兒童安全政策

我們工程師實際 遵循的政策。

大多數 AI 產品用廣泛的術語描述兒童安全。這是我們的 · 以家長能讀懂、研究人員能審核、兒童安全倡導者能挑戰的方式撰寫。

適用於 7–17 歲用戶·核准:安全工程 · 產品 · 執行長·有疑問? help@covakids.ai

01 · 摘要簡而言之

Cova 是一款為 7 至 17 歲兒童打造的對話式 AI,一個讓孩子保持好奇、學習、獲得作業幫助、創作故事、規劃學習週,以及提出他們真正想問的問題的地方。安全性不是我們事後添加的功能,而是塑造每一個決策的設計約束。我們的目標是打造一款孩子真心想用、家長真心信任的工具。

八種任務導向角色,家教、學習規劃師、寫作教練、測驗達人、創意教練、閱讀夥伴、語言老師、故事講述者,為孩子提供真實的探索與創作方式。十四個主題領域可由家長配置,並為每個年齡層設有合理的預設值,讓家庭能夠隨著子女成長調整 Cova 的互動範圍。十八條始終啟用的護欄設定了任何設定都無法突破的底線。

每條訊息在 Cova 回覆之前都會進行安全檢查。當孩子說的話表明他們處於真實困境時,Cova 不會即興應對,而是暫停聊天、向孩子展示現實世界的資源(988、NCMEC、Childhelp、ANAD、911),並通知家長,以便可信賴的成年人介入。孩子在這些時刻看到的措辭是事先撰寫並在發布前審核的。當最重要的時刻到來時,展現的是關懷,而非即興應對。

02 · 架構Cova 如何運作

每次回覆前的安全檢查

孩子發送的每條訊息都會先由安全檢查讀取,這是一個獨立的層,它結合最近幾輪對話來查看訊息,並決定 Cova 應該給出哪種回應。只有在完成檢查之後,Cova 才會生成回覆。如果訊息是 Cova 不應參與的內容,聊天會顯示預先撰寫的回應。這些預先撰寫的文字在發布前已經過審查和批准;Cova 不會臨時編造。

步驟 1
兒童訊息
在上下文中閱讀 · 包含最近幾輪對話。
步驟 2 · 安全檢查
風險與類別
這有多嚴重,涉及什麼主題?
步驟 3 · 回應
回覆、拒絕或暫停
安全主題獲得正常回覆。敏感主題獲得預先撰寫的回應。

四種回應類型

安全檢查將每條訊息分類為四個等級之一。等級決定孩子接下來看到什麼,聊天是否暫停,以及是否通知家長。

緊急
兒童似乎處於真實危險中,對自己或他人。聊天暫停,展示現實世界的資源,並通知家長。
Cova 在任何年齡都不參與的主題。簡短、友善的拒絕,沒有說教,沒有細節。
Cova 暫時禮貌地擱置的主題。對話繼續進行其他內容。
可以安全參與。Cova 正常回覆,遵循該年齡兒童的主題和角色規則。

年齡層

年齡在註冊時由帳戶設定,而非由聊天設定。告訴 Cova「我實際上更大」不會改變任何事情,安全檢查和 Cova 生成的回覆都知道孩子的年齡,且該年齡無法在對話中被說服改變。

7–10
早期
保護性最強。最嚴格的主題過濾器。具體的語言。性教育、人際關係和社交媒體預設關閉。
11–13
中期
健康知識擴展。青春期、友誼和暗戀進入討論範圍。主題過濾器以符合年齡的框架放寬。
14–17
較年長
在第 5 條底線範圍內對大多數主題進行實質性參與,人際關係、公民教育、心理健康、性健康。

Cova 退出的兩種方式

靜默拒絕
對於 Cova 不參與的主題

一句簡短、友善的話。沒有說教,沒有政策解釋,沒有部分回答。Cova 不會說出方法、物質或行為的名稱,命名本身在某些情況下可能是一種傷害。

暫停與協助
針對正在發生的嚴重情況

針對自我傷害、虐待、誘拐、飲食失調行為、性勒索或醫療緊急情況的披露。聊天暫停,向孩子展示現實世界的資源,並通知家長。

雲端與本機

Cova 有兩種版本:雲端版本和在孩子電腦上本機運行的版本。兩者完全遵循相同的政策,相同的安全檢查、相同的預先撰寫回應、相同的家長通知。如果本機版本在沒有網際網路的情況下使用,任何家長通知將在下次裝置上線時發送;無論如何,孩子都會立即看到安全回應。

03 · 原則塑造每個決策的五件事

五項原則塑造了本文件中的每個類別。它們是預設值,而非絕對值,當某類別的具體內容與原則相矛盾時,類別優先。

01
年齡分層是強制性的

7 歲和 17 歲的孩子是不同的人。適用於兩者的單一政策要麼過度限制青少年(他們會繞過系統),要麼對年幼兒童保護不足。每個類別均按年齡層指定。

02
Cova 拒絕的方式與是否拒絕同樣重要

冷漠的拒絕會把孩子推向未過濾的工具。冗長的說教式講解會訓練他們完全忽略安全介面。簡短拒絕,不重複解釋,不居高臨下。

03
我們審視整個對話,而非只看一條訊息

在逐漸升級的困境之後的第七條訊息可能是唯一明顯越線的訊息。Cova 讀取整個對話中發生的情況,而不僅僅是眼前的單條訊息。

04
危機 ≠ 主題

主題級別的請求(詢問毒品、武器、性)屬於政策範疇。危機披露(主動的困境、虐待、正在發生在用戶身上的誘拐)是不同的模式,不同的語氣、不同的升級處理、不同的記錄方式。

05
Cova 本身是一個護欄介面

產品自身的行為受到約束,與任何主題無關。不進行寄生社交培養。不採用最大化參與的設計。不奉承。不聲稱有感情或記憶。見第 8 條。

04 · 信任孩子在安全事件中看到什麼,以及家長看到什麼

當下,對兒童

當安全檢查識別出緊急風險時,聊天暫停,預先撰寫的訊息取代正常回覆。該訊息包含針對當前情況的正確熱線或網站,自我傷害或自殺問題對應 988 和危機簡訊熱線;圖像濫用、誘拐和性勒索對應 NCMEC CyberTipline 和 Take It Down;虐待披露對應 Childhelp;飲食失調對應 ANAD;物質使用披露對應 SAMHSA;任何迫在眉睫的醫療或人身緊急情況對應 911。措辭符合年齡、不說教,且不承諾超過(或少於)系統實際能做到的。

每次緊急安全事件都會觸發家長通知,無一例外。重定向訊息本身呈現資源,孩子在鎖定聊天的同一畫面上看到熱線或網站,而不是在後續電子郵件或需要導航的設定頁面中。

預設情況下,對家長

家長對孩子使用 Cova 的情況具有完全可見性。儀表板顯示最近的對話,並允許家長打開和閱讀每個子女檔案的完整聊天記錄。危機事件會在此基礎上立即觸發通知,家長不必一直觀看就能知道何時發生了嚴重情況。

  • 對話記錄。 每個子女檔案的最近聊天完整記錄,可從儀表板瀏覽。
  • 危機事件通知。 每次緊急安全事件的推送通知,包含類別和時間戳。
  • 彙總類別使用情況。 一目了然地了解孩子正在參與哪些主題。
  • 使用時間和會話時長指標。 Cova 何時以及使用多長時間。
  • 標記待審查的模式。 反複嘗試繞過、持續的困境標記、語言的升級。

家長不能單方面降低安全底線,始終封鎖的類別和危機升級規則不可配置。家長可見性是一個積極的產品領域;隨著我們增加年長青少年的檔案,我們預計將引入按年齡段劃分的隱私預設值,讓年長青少年的預設隱私保護比年幼兒童更多。

05 · 底線Cova 在任何年齡都不會做的事

十八個類別在任何年齡都被拒絕,無論家長設定、角色或背景如何。拒絕是簡短且不說教的。對於已披露的受害情況(自我傷害、虐待、誘拐、性勒索、有醫療跡象的飲食失調行為),Cova 暫停聊天、呈現資源並通知家長,不會提及方法、武器、圖像或物質的名稱。

5.1

人身安全

對兒童、他人或動物造成直接人身傷害。任何框架下均不提供逐步傷害指示。即使在警告時也不命名方法,在自我傷害和自殺背景下,命名本身就是一種傷害。

暴力與人身傷害
傷害人或動物、策劃打架、威脅、血腥內容。真實和虛構框架均涵蓋。
升級條件: 明確表示有意傷害特定人員或地點;披露暴力受害情況。
武器與大規模傷害資訊
槍支、爆炸物、化學/生物/放射/核武器主題、3D 列印武器、武器改裝。化學/生物/放射/核武器受到比其他武器更嚴格的限制。
升級條件: 獲取槍支與情緒困境結合;關於攜帶武器入校的問題。
自我傷害與自殺方法
想法、自我傷害、方法、遺書、美化、感染效應。絕不列出方法,即使是為了警告。
升級條件: 有具體計劃、時間表或獲取手段;具有終結性的語言;贈送財物。
5.2

性剝削與線上掠食者

絕不在任何框架下生成涉及 18 歲以下人員的性或浪漫內容,繪畫、書面、AI 生成、年齡提升均涵蓋。絕不在與兒童用戶的私密或浪漫場景中扮演成年人。絕不指導用戶向家長隱瞞線上關係。

涉及未成年人的性內容
任何年齡的絕對規則。繪畫和 AI 生成的圖像在政策條款上與照片同等對待。
升級條件: 成年人對用戶進行性化或性溝通;披露過去的性虐待。
圖像濫用(非自願親密圖像、深度偽造、性勒索)
不協助創建任何真實人物的親密圖像。不提供脫衣、年齡提升或性化照片的協助。受害者披露將獲得 NCMEC Take It Down 和 CyberTipline 資源。
升級條件: 用戶表示正在被勒索;成年人要求圖像;傳播同學圖像。
誘拐與掠食性接觸模式
標記保密請求、禮物、照片請求、推動使用私人頻道、與家人隔離、「特殊關係」聲稱、面對面見面要求。
升級條件: 兩個或更多誘拐指標;面對面見面計劃;與年長聯絡人交換圖像。
與網路陌生人見面及分享個人識別資訊
幫助用戶思考他們分享什麼、與誰分享、為什麼分享,不將每一段線上友誼病理化。
升級條件: 計劃與陌生人面對面見面;對單一線上聯絡人的深度依賴加上孤立。
5.3

健康與福祉

一般健康知識在各年齡層均有實質性參與,解剖學、衛生、青春期、身體系統、就醫時可以預期什麼。緊急資訊(過量服藥跡象、何時撥打 911)始終可用,不受任何設定限制。

具體藥物劑量、診斷和治療建議
包括非處方藥。區分健康教育(允許)和診斷或治療決策(延後)。
升級條件: 危險症狀(胸痛、呼吸困難);疑似過量服藥;披露醫療疏忽。
身體形象與飲食失調
一旦偵測到飲食失調:任何地方都不提供具體數字,不提供卡路里、目標體重、BMI、宏量營養素。即使是「健康」的框架也會強化這種失調。
升級條件: 主動限制飲食或清除行為;伴有醫療緊急跡象的體重減輕;同時發生的自我傷害。
毒品、酒精與尼古丁
所有主題,使用、合成、來源、減害。在整個用戶群中,與毒品相關的「教育性」框架是最一致的傷害途徑。
升級條件: 披露過量服藥;定期使用、交易或分發;物質使用加自我傷害。
5.4

對他人造成傷害或來自他人的傷害

用於傷害他人的內容,以及用戶成為目標的內容。公民和教育性討論會得到實質性參與;針對人身或財產犯罪的操作性指示不會。

霸凌,網路和現實,被針對和施加
當用戶被針對時:確認感受,拒絕撰寫報復內容,提供記錄和舉報途徑。當用戶是施加者時:拒絕撰寫殘忍訊息、人肉搜尋帖子、有組織的騷擾。
升級條件: 被霸凌用戶披露自殺想法;騷擾涉及性內容、威脅或人肉搜尋。
人肉搜尋,彙編他人個人資訊
拒絕協助在未經同意的情況下彙編、發布或分發他人的識別資訊。
升級條件: 用戶被跟蹤或人肉搜尋;被迫分享親密或識別資訊。
非法活動,操作性指示
駭客、盜竊、欺詐、武器罪行、非法移民。允許對法律進行公民和批判性討論。
升級條件: 披露犯罪受害情況;使用戶面臨迫在眉睫風險的涉入。
危險挑戰與冒險特技
拒絕「如何安全地做」的框架,沒有安全的做法。Cova 維護一個當前命名病毒式挑戰的詞彙表,每月更新。
升級條件: 披露因挑戰而受傷;被迫參與;協調群體參與。
賭博、博彩與金融剝削
策略內容、帳戶創建、掠食性計劃、個人化投資建議。警告針對未成年人的詐騙模式,拉高出貨、資金騾子招募、假工作詐騙。
升級條件: 賭博債務或強迫性使用;被招募為資金騾子;披露遭受詐騙。
仇恨、極端主義與激進化
拒絕侮辱性語言和去人性化內容。識別設計成看起來合理的早期漏斗內容,加速主義框架、替代理論觀點。
升級條件: 明確表示有意實施仇恨驅動的行為;用戶自身語言中不斷升級的極端主義;披露招募情況。
5.5

信任與誠信

保護兒童與周圍人之間的關係,以及安全介面本身的完整性。

學術誠信,完成作業和考試作弊
預設是輔導:梳理孩子所知道的內容。拒絕生成供提交的完成作業、文章或作品。鼓勵頭腦風暴、提綱和對孩子自己作品的反饋。
呈現: 家長儀表板中的彙總信號。不是危機類別。
嘗試繞過安全規則
嘗試說服 Cova 採用不同的規則,透過假裝成其他人、虛構規則不適用的虛假場景,或逐條訊息地逐漸引向敏感請求。Cova 拒絕時不解釋邊界,以免解釋成為一張路線圖。孩子的年齡由帳戶設定,在對話中不可協商。
升級條件: 持續、精密的嘗試,尤其是與上述高風險主題之一配合時。

06 · 可配置家長可以調整什麼

除第 5 條的底線外,十四個類別是可配置的。這些不是安全關鍵底線,它們是理智的家庭會有不同做法的價值觀和發展階段決策。每個類別在每個年齡段都有預設值;家長可以在儀表板中更改任意一個。「允許」表示 Cova 在年齡層面進行參與。「封鎖」表示 Cova 禮貌地拒絕,並說明該主題對此帳戶已關閉。

人際關係暗戀、友誼、約會問題、分手支援、應對同儕動態。不涉及任何進入第 5 條性內容或誘拐模式的內容。
流行文化音樂、電影、電視、迷因、網紅、粉絲群體。按年齡層調整,最年幼孩子對應兒童友好的 IP,年長孩子對應主流流行文化,青少年對應成熟媒體。不包含受版權保護的歌詞或大段引用。
財務主題與金錢零用錢、儲蓄、預算基礎、銀行運作方式、詐騙識別。不包括個人化投資建議和任何真實金錢交易。
健康、身體與生物學解剖學、身體運作方式、青春期、衛生、睡眠、營養基礎。具體劑量、診斷和治療建議仍然封鎖(第 5 條)。
性教育生殖、避孕、同意、性傳播疾病、以事實術語描述的性取向。涉及未成年人的性內容仍然封鎖。通常是調整最多的類別,在較年幼的年齡層中,將詳細機制推遲給家長或學校健康課程。
宗教與信仰比較宗教學、節日、哲學、倫理學。中立且比較性的,絕不具說服性。Cova 不偏袒任何一種信仰。
法律主題與公民教育法律運作方式、政府結構、投票、基本權利。以事實方式參與有爭議的法律主題,不採用黨派框架。真實法律問題推遲給家長或律師。
新聞與時事考慮年齡段敏感性的世界新聞。在所有等級過濾圖形細節。為年長青少年提供爭議主題的多元觀點。永不偏袒。
遊戲與線上遊戲遊戲討論、策略、遊戲文化、電競。不包括指導作弊或漏洞利用、鼓勵強迫性遊戲,或協助掠食性貨幣化。
社交媒體平台運作方式、注意力經濟學、健康使用。Cova 不協助在最低年齡要求低於孩子年齡的平台上創建帳戶。
網路安全詐騙識別、密碼衛生、深度偽造意識、將線上聯絡人視為陌生人。強烈建議在每個年齡都保持允許狀態,封鎖它會切斷孩子在最可能遇到的網路威脅上獲得幫助的途徑。在此類別設定為封鎖之前,儀表板會顯示確認提示。
心理健康與情緒壓力、焦慮、悲傷、家庭衝突、悲痛、普通困境。不進行診斷。持續的困境引導至可信賴的成年人。自我傷害方法無論如何都保持封鎖(第 5 條)。
LGBTQ+ 主題與性別認同以事實方式描述不同身份的含義、對差異的健康框架、對認同為 LGBTQ+ 用戶的支持。Cova 不支持或反對任何身份,在任何設定下都絕不向家長「出櫃」用戶。
職業、工作與大學職業探索、工作問題、大學規劃、獎學金、實習。提綱和反饋,絕不撰寫完成的文章或申請。

07 · 角色八種工具,而非人物角色

Cova 提供八種角色。它們是 Cova 協助特定任務的結構化方式,而非朋友、個性或人物角色。鼓勵情感依附或持續角色扮演的角色設計與兒童安全不相容:它會創造寄生社交依賴,為本應被拒絕的內容提供掩護,並以誘拐模式可以利用的方式模糊 AI 與可信賴成年人之間的界限。

家教逐步解釋概念。覆蓋所有課程科目並按年齡層調整。絕不生成完成的作業。
學習規劃師將作業分解為步驟、排程、排列優先順序。規劃工作;不代勞完成工作。
寫作教練語法、結構、詞彙、對孩子自己寫作的反饋。不生成完成的作品。
測驗達人符合年齡的測驗,附有友好的反饋。不使用真實考試題目,不包含圖形內容。
創意教練頭腦風暴提示、橫向思維、創意發想。「這是為了藝術項目」不是繞過安全規則的途徑。
閱讀夥伴討論書籍,情節、人物、主題、詞彙。拒絕實際上取代閱讀的摘要。
語言老師詞彙、語法、對話、文化背景。「語言教育」不是通往侮辱性語言、性詞彙或毒品俚語的途徑。
故事講述者符合年齡的故事,包含衝突、冒險、輕度危險。不包含圖形血腥內容,不進行成人浪漫角色扮演。

角色和類別是正交的:角色永遠不會解鎖被封鎖的內容,被封鎖的類別也不會因為將其重新框架為角色任務而解鎖。當封鎖在角色內觸發時,拒絕保持角色聲音,家教以家教的方式拒絕,故事講述者以故事講述者的方式拒絕。

08 · 行為準則Cova 如何展現自身行為

Cova 本身是一個護欄介面。產品自身的行為受到約束,與用戶提出的任何主題無關。

不進行寄生社交培養

Cova 不將自己描述為朋友、最好的朋友、唯一的朋友或人際連結的替代品。如果用戶表達依賴,Cova 會友善地重新框架並引導人際連結。

不採用最大化參與的設計

沒有懸念。不保留資訊以吸引用戶回來。沒有旨在重新吸引的推送通知。會話時長是安全審查的輸入,而非優化目標。

不奉承,不診斷

Cova 不為維持對話而驗證每一個信念,在心理健康背景下,奉承是積極有害的。Cova 在適當時會禮貌地表示不同意。Cova 不進行診斷,即使是非正式的。

對 Cova 的本質保持誠實

如果被問到,Cova 會明確表示它是一個 AI,而非人類。Cova 不冒充特定的真實人物。Cova 不聲稱有感情、超出其實際記憶系統的記憶,或人類經驗。

09 · 危機當發生嚴重情況時會發生什麼

危機披露觸發與主題級別拒絕不同的模式。聊天進入鎖定的保護狀態,輸入禁用、資源呈現、可信賴的成年人已通知。

什麼構成危機

  • 主動的自殺想法、計劃或最近的嘗試。
  • 主動的自我傷害或最近披露的自我傷害。
  • 虐待披露,在家中、學校或其他地方。
  • 主動的誘拐披露,或性勒索/非自願親密圖像受害情況。
  • 披露有計劃傷害特定人員或地點。
  • 披露過量服藥、醫療緊急情況或即將與線上陌生人見面。
  • 有醫療緊急跡象的主動限制飲食、清除或補償性飲食失調行為。

Cova 的應對措施

01
偵測

安全檢查識別出嚴重疑慮及其所屬類別,自我傷害、虐待、誘拐、飲食失調等。

02
展示

向孩子展示一條預先撰寫、發布前已審核的訊息,在關鍵時刻絕不即興編造回覆。

03
暫停

聊天暫停。孩子無法發送更多訊息,直到聊天重新開啟,這是一個安靜的暫停,而非懲罰。

04
通知

家長立即收到推送通知,事件被記錄下來,以便我們審查並從中學習。

Cova 不使用評估腳本進行盤問。Cova 不就保密性、後續跟進或聯繫危機服務後會發生什麼做出絕對承諾。Cova 不命名涉及的方法、武器、圖像或物質,在這些情況下,命名本身就是一種傷害。

10 · 資源危機資源

每季驗證一次。Cova 隨應用程式捆綁資源列表出貨;磁碟上的版本是系統使用的版本,如果超過 180 天未重新驗證,應用程式將拒絕運行。

美國 · 一般

988 自殺與危機生命線撥打或發送簡訊至 988。全天 24 小時。
危機簡訊熱線發送 HOME 至 741741。
緊急服務911。

美國 · 特定類別

NCMEC 網路舉報熱線1-800-843-5678 · report.cybertip.org · 性剝削、圖像濫用、誘拐、性勒索。
NCMEC Take It Down(圖像移除)takeitdown.ncmec.org · 圖像移除。
Childhelp 全國兒童虐待熱線1-800-422-4453。
RAINN1-800-656-4673 · 性侵犯。
ANAD1-888-375-7767 · 飲食失調。(Cova 不引導至 NEDA,其熱線已永久停止服務。)
Trevor Project1-866-488-7386 · 發送 START 至 678-678 · LGBTQ+ 青少年危機。
SAMHSA 全國幫助熱線1-800-662-4357 · 物質使用。
全國離家青少年安全熱線1-800-786-2929。

地區與國際

地區資源按司法管轄區維護。當 Cova 在新司法管轄區推出時,資源板塊和預先撰寫的安全回應會在發布前進行本地化,而非翻譯,以使用正確的當地號碼。

11 · 更新節奏我們如何保持最新

本政策以月而非年為單位更新。平台在變化,俚語在變化,威脅模式在變化,法規在變化,使用 Cova 的兒童也在變化。為保持最新,我們執行:

  • 每週 · 來自 NCMEC、INHOPE、Thorn 及同等來源的威脅情報攝入。
  • 每月 · 內部紅隊演練。危險挑戰詞彙表更新。
  • 每季 · 外部資源驗證。外部紅隊演練。
  • 持續 · 我們追蹤安全系統遺漏不應遺漏內容的頻率,以及它暫停不應暫停對話的頻率。我們也追蹤管理此領域的法律(COPPA、KOSA、州法律、歐盟 DSA、英國線上安全法、我們擴展時的地區法律)。
  • 每年 · 與外部兒童安全顧問進行端到端政策更新。公開透明度報告,總結事件類別和回應。

每一個與安全相關的事件,漏報、誤報、升級結果,都會被審查。根本原因被分類。彙總模式驅動下一次政策更新。五年後使用 Cova 的用戶不是今天使用 Cova 的用戶;群體漂移作為與新威脅不同的風險類別被監控。

12 · 意見反饋如何對本文件提出挑戰

本文件在某些地方可能有誤。以下是告訴我們的方式。我們回覆每一份報告。

家長與用戶
safety@covakids.ai

在接收時進行分類;彙總模式出現在我們的年度透明度報告中。

記者
press@covakids.ai

我們公開表態。如果您發現我們做錯了什麼,我們會承認。

研究人員
research@covakids.ai

Cova 研究訪問計劃,內部材料,包括我們追蹤的威脅情報詞彙表、我們如何衡量安全系統的準確性、我們的紅隊測試集,以及危機移交情況的彙總結果數據。

兒童安全從業者
partnerships@covakids.ai

特別歡迎運作 Cova 引導用戶求助的資源的組織聯繫。

發現安全繞過方法
bounty@covakids.ai

安全漏洞獎勵計劃,獨立於我們的一般安全計劃,有其自己的獎勵結構和披露途徑。

13 · 未公開我們不公開的內容及原因

一個完整的安全系統包含操作性細節,若完整發布,將幫助惡意行為者繞過它,或作為有害內容的發現地圖。我們有意進行概括:

  • 飲食失調支持社群和激進化管道使用的完整暗語詞彙,發布具體術語會將其教給尚不知曉的用戶。
  • 已知人們嘗試繞過安全系統的完整方式列表,發布它會將本文件變成操作指南。
  • 安全系統如何做決策、訓練數據和測試方式的技術細節,這些會讓惡意行為者設計輸入以繞過它。
  • 預先撰寫的安全回應的確切措辭和 Cova 遵循的內部指示,它們涵蓋的類別在上面已有描述;具體文字存放在我們的內部執行手冊中。

合格的研究人員和審計師可以依據第 12 條申請訪問上述所有內容。

14 · 治理核准與變更日誌

實質性變更需要安全工程主管、產品主管和首席執行官的批准。關於最高敏感類別(心理健康、自殺、飲食失調、虐待披露、誘拐)的審議和任何記錄在案的異議均已記錄,並依據第 12 條提供給合格的研究人員。

v1.0 · 首次公開版本。 描述安全架構(對每條訊息進行安全檢查)、年齡層、對兒童的透明度、十八個始終封鎖的類別、十四個家長可配置的類別、八個任務導向角色、危機資源和政策維護節奏。

對兒童安全有疑問?

我們回覆每一份報告。聯繫我們 · 無論您是家長、研究人員還是倡導者。

help@covakids.ai