人類安全保障負責人辭職,並警告人工智慧安全危機日益加劇

本文為機器翻譯
展示原文

領導 Anthropic 安全保障研究的 Mrinank Sharma 昨天從這家人工智慧公司辭職,並公開了他的離職信。

在發布給X的信中,夏爾馬指出,人工智慧組織以及更廣泛的社會中,其宣稱的原則與實際決策之間存在差距,這令人日益不安。他描述了倫理承諾與實際操作之間日益擴大的脫節。

今天是我在Anthropic的最後一天。我辭職了。

這是我寫給同事們的信,解釋了我的決定。 pic.twitter.com/Qe4QyAFmxL

— mrinank (@MrinankSharma) 2026年2月9日

「對我來說,很明顯,是時候繼續前進了,」夏爾馬寫道。

Sharma曾在Claude開發公司工作兩年,主要負責防禦人工智慧引發的生物威脅、內部問責工具以及早期人工智慧安全措施記錄框架的研究。他還研究了聊天機器人如何強化用戶偏見並逐步改變人類判斷。

這位研究人員讚揚了前同事的技術水平和嚴謹的道德品質,但也暗示將不再從事企業人工智慧的工作。他宣布計劃從事寫作、私人輔導,並可能攻讀詩歌方向的研究生學位。

在他離職之前,外界高度關注領先的人工智慧開發人員如何管理內部異議、揭露風險以及在快速提升能力與安全研究之間取得平衡。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
69
收藏
19
評論