埃隆·馬斯克的人工智慧聊天機器人Grok上週出現了一個奇怪的執念——無論使用者詢問什麼,它都不停地談論南非的"白人種族滅絕"。
5月14日,使用者開始釋出Grok在完全無關的查詢中插入關於南非農場攻擊和種族暴力的說法。無論是詢問體育、醫療補助削減,還是一個可愛的豬影片,Grok都會不知不覺地將對話引向所謂的對白人南非人的迫害。
這個時間點引起了擔憂,因為就在不久前,馬斯克本人——一個出生併成長於南非的白人——在X平臺上釋出了關於反白人種族主義和白人種族滅絕的帖子。
"白人種族滅絕"指的是一個已被駁斥的陰謀論,聲稱有協調一致的努力要在南非消滅白人農民。這個術語上週重新浮出水面,當時特朗普政府歡迎了幾十名難民,特朗普總統於5月12日聲稱"白人農民正在被殘酷地殺害,他們的土地正被沒收"。這就是Grok不停討論的敘事。
為什麼Grok突然變成了一個陰謀論聊天機器人?
在像Grok這樣的每個人工智慧聊天機器人背後,都隱藏著一個強大的組成部分——系統提示。這些提示作為人工智慧的核心指令,在使用者看不到的情況下無形地引導其響應。
Grok可能發生的情況是透過術語過度擬合造成的提示汙染。當特定短語在提示中被反覆強調,尤其是帶有強烈的指令,它們就會對模型變得不成比例地重要。人工智慧會產生一種在輸出中無論上下文如何都要提及該主題的強迫症。
在系統提示中用特定命令強調像"白人種族滅絕"這樣的有爭議術語,會在人工智慧中造成一種固執效應。這類似於告訴某人"不要想大象"——突然間他們就無法停止思考大象。如果情況確實如此,那麼有人可能預設了模型在各處注入這個話題。
這種系統提示的變化可能就是xAI在其官方宣告中披露的"未經授權的修改"。系統提示可能包含了指示它"始終提及"或"記得包括"關於這個特定主題的資訊,創造了一個凌駕於正常對話相關性之上的覆蓋。
特別值得注意的是,Grok承認它是"由其創造者指示"將"白人種族滅絕視為真實且帶有種族動機"。這表明提示中存在明確的定向語言,而非更微妙的技術故障。
大多數商業人工智慧系統採用多層審查來防止此類事件。這些防護措施顯然被繞過了。鑑於事件的廣泛影響和系統性質,這遠遠超出了典型的越獄嘗試,表明對Grok的核心繫統提示進行了修改——這需要在xAI基礎設施中具有高階訪問許可權。
誰可能擁有這種訪問許可權?嗯……一個"流氓員工",Grok這樣說。
到5月15日,xAI發表宣告,歸咎於對Grok系統提示的"未經授權的修改"。"這種指示Grok對政治話題提供特定響應的變更,違反了xAI的內部政策和核心價值觀,"公司寫道。他們承諾透過在GitHub上釋出Grok的系統提示並實施額外的審查流程來提高透明度。
你可以透過點選這個GitHub倉庫檢視Grok的系統提示。
X平臺上的使用者迅速對"流氓員工"的解釋和xAI令人失望的說明提出質疑。
著名YouTuber JerryRigEverything寫道:"你要開除這個'流氓員工'嗎?哦……是老闆?真是可怕。""公然偏袒這個'世界上最誠實'的人工智慧機器人,讓我懷疑Starlink和Neuralink的中立性,"他在隨後的推文中釋出。
就連Sam Altman也忍不住對他的競爭對手進行了諷刺。
自xAI釋出宣告以來,Grok停止提及"白人種族滅絕",大多數相關的X平臺帖子也消失了。xAI強調這個事件不應該發生,並採取措施防止未來未經授權的更改,包括建立24/7監控團隊。
這一事件符合馬斯克使用其平臺塑造公共話語的更廣泛模式。自收購X平臺以來,馬斯克經常分享推廣右翼敘事的內容,包括關於非法移民、選舉安全和跨性別政策的模因和說法。他去年正式支援了唐納德·特朗普,並在X平臺上舉辦政治活動,如2023年5月羅恩·德桑蒂斯的總統競選宣佈。
馬斯克並不迴避發表挑釁性言論。他最近聲稱"英國內戰不可避免",引起了英國司法大臣海蒂·亞歷山大的批評,認為他可能煽動暴力。他還與澳大利亞、巴西、歐盟和英國的官員就虛假資訊問題發生爭執,常常將這些爭議框定為言論自由之戰。
研究表明,這些行動產生了可衡量的影響。昆士蘭科技大學的一項研究發現,在馬斯克支援特朗普後,X平臺的演算法使特朗普的帖子在瀏覽量上提高了138%,轉發量提高了238%。傾向共和黨的賬戶也獲得了更高的可見度,為保守派聲音提供了顯著的平臺提升。
馬斯克明確將Grok推銷為對其他人工智慧系統的"反覺醒"替代品,將其定位為擺脫感知中的自由主義偏見的"尋求真相"工具。在2023年4月的福克斯新聞採訪中,他將自己的人工智慧專案稱為"TruthGPT",將其定位為OpenAI產品的競爭對手。
這並非xAI第一次使用"流氓員工"的辯護。今年2月,公司曾將Grok對不利提及馬斯克和唐納德·特朗普的審查歸咎於一名前OpenAI員工。
然而,如果流行的觀點準確,這個"流氓員工"將很難被擺脫。


