領導 Anthropic 安全保障研究的 Mrinank Sharma 昨天從這家人工智慧公司辭職,並公開了他的離職信。
在發布給X的信中,夏爾馬指出,人工智慧組織以及更廣泛的社會中,其宣稱的原則與實際決策之間存在差距,這令人日益不安。他描述了倫理承諾與實際操作之間日益擴大的脫節。
今天是我在Anthropic的最後一天。我辭職了。
這是我寫給同事們的信,解釋了我的決定。 pic.twitter.com/Qe4QyAFmxL
— mrinank (@MrinankSharma) 2026年2月9日
「對我來說,很明顯,是時候繼續前進了,」夏爾馬寫道。
Sharma曾在Claude開發公司工作兩年,主要負責防禦人工智慧引發的生物威脅、內部問責工具以及早期人工智慧安全措施記錄框架的研究。他還研究了聊天機器人如何強化用戶偏見並逐步改變人類判斷。
這位研究人員讚揚了前同事的技術水平和嚴謹的道德品質,但也暗示將不再從事企業人工智慧的工作。他宣布計劃從事寫作、私人輔導,並可能攻讀詩歌方向的研究生學位。
在他離職之前,外界高度關注領先的人工智慧開發人員如何管理內部異議、揭露風險以及在快速提升能力與安全研究之間取得平衡。




