猜猜是谁:xAI 将“白人种族灭绝”归咎于一名“流氓员工” Grok 帖子

avatar
Decrypt
05-18
本文为机器翻译
展示原文

埃隆·马斯克的人工智能聊天机器人Grok上周出现了一个奇怪的执念——无论用户询问什么,它都不停地谈论南非的"白人种族灭绝"。

5月14日,用户开始发布Grok在完全无关的查询中插入关于南非农场攻击和种族暴力的说法。无论是询问体育、医疗补助削减,还是一个可爱的猪视频,Grok都会不知不觉地将对话引向所谓的对白人南非人的迫害。

这个时间点引起了担忧,因为就在不久前,马斯克本人——一个出生并成长于南非的白人——在X平台上发布了关于反白人种族主义和白人种族灭绝的帖子。

"白人种族灭绝"指的是一个已被驳斥的阴谋论,声称有协调一致的努力要在南非消灭白人农民。这个术语上周重新浮出水面,当时特朗普政府欢迎了几十名难民,特朗普总统于5月12日声称"白人农民正在被残酷地杀害,他们的土地正被没收"。这就是Grok不停讨论的叙事。

为什么Grok突然变成了一个阴谋论聊天机器人?

在像Grok这样的每个人工智能聊天机器人背后,都隐藏着一个强大的组成部分——系统提示。这些提示作为人工智能的核心指令,在用户看不到的情况下无形地引导其响应。

Grok可能发生的情况是通过术语过度拟合造成的提示污染。当特定短语在提示中被反复强调,尤其是带有强烈的指令,它们就会对模型变得不成比例地重要。人工智能会产生一种在输出中无论上下文如何都要提及该主题的强迫症。

在系统提示中用特定命令强调像"白人种族灭绝"这样的有争议术语,会在人工智能中造成一种固执效应。这类似于告诉某人"不要想大象"——突然间他们就无法停止思考大象。如果情况确实如此,那么有人可能预设了模型在各处注入这个话题。

这种系统提示的变化可能就是xAI在其官方声明中披露的"未经授权的修改"。系统提示可能包含了指示它"始终提及"或"记得包括"关于这个特定主题的信息,创造了一个凌驾于正常对话相关性之上的覆盖。

特别值得注意的是,Grok承认它是"由其创造者指示"将"白人种族灭绝视为真实且带有种族动机"。这表明提示中存在明确的定向语言,而非更微妙的技术故障。

大多数商业人工智能系统采用多层审查来防止此类事件。这些防护措施显然被绕过了。鉴于事件的广泛影响和系统性质,这远远超出了典型的越狱尝试,表明对Grok的核心系统提示进行了修改——这需要在xAI基础设施中具有高级访问权限。

谁可能拥有这种访问权限?嗯……一个"流氓员工",Grok这样说。

到5月15日,xAI发表声明,归咎于对Grok系统提示的"未经授权的修改"。"这种指示Grok对政治话题提供特定响应的变更,违反了xAI的内部政策和核心价值观,"公司写道。他们承诺通过在GitHub上发布Grok的系统提示并实施额外的审查流程来提高透明度。

你可以通过点击这个GitHub仓库查看Grok的系统提示。

X平台上的用户迅速对"流氓员工"的解释和xAI令人失望的说明提出质疑。

著名YouTuber JerryRigEverything写道:"你要开除这个'流氓员工'吗?哦……是老板?真是可怕。""公然偏袒这个'世界上最诚实'的人工智能机器人,让我怀疑Starlink和Neuralink的中立性,"他在随后的推文中发布。

就连Sam Altman也忍不住对他的竞争对手进行了讽刺。

自xAI发布声明以来,Grok停止提及"白人种族灭绝",大多数相关的X平台帖子也消失了。xAI强调这个事件不应该发生,并采取措施防止未来未经授权的更改,包括建立24/7监控团队。

这一事件符合马斯克使用其平台塑造公共话语的更广泛模式。自收购X平台以来,马斯克经常分享推广右翼叙事的内容,包括关于非法移民、选举安全和跨性别政策的模因和说法。他去年正式支持了唐纳德·特朗普,并在X平台上举办政治活动,如2023年5月罗恩·德桑蒂斯的总统竞选宣布。

马斯克并不回避发表挑衅性言论。他最近声称"英国内战不可避免",引起了英国司法大臣海蒂·亚历山大的批评,认为他可能煽动暴力。他还与澳大利亚、巴西、欧盟和英国的官员就虚假信息问题发生争执,常常将这些争议框定为言论自由之战。

研究表明,这些行动产生了可衡量的影响。昆士兰科技大学的一项研究发现,在马斯克支持特朗普后,X平台的算法使特朗普的帖子在浏览量上提高了138%,转发量提高了238%。倾向共和党的账户也获得了更高的可见度,为保守派声音提供了显著的平台提升。

马斯克明确将Grok推销为对其他人工智能系统的"反觉醒"替代品,将其定位为摆脱感知中的自由主义偏见的"寻求真相"工具。在2023年4月的福克斯新闻采访中,他将自己的人工智能项目称为"TruthGPT",将其定位为OpenAI产品的竞争对手。

这并非xAI第一次使用"流氓员工"的辩护。今年2月,公司曾将Grok对不利提及马斯克和唐纳德·特朗普的审查归咎于一名前OpenAI员工。

然而,如果流行的观点准确,这个"流氓员工"将很难被摆脱。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论