领导 Anthropic 安全保障研究的 Mrinank Sharma 昨天从这家人工智慧公司辞职,并公开了他的离职信。
在发布给X的信中,夏尔马指出,人工智慧组织以及更广泛的社会中,其宣称的原则与实际决策之间存在差距,这令人日益不安。他描述了伦理承诺与实际操作之间日益扩大的脱节。
今天是我在Anthropic的最后一天。我辞职了。
这是我写给同事们的信,解释了我的决定。 pic.twitter.com/Qe4QyAFmxL
— mrinank (@MrinankSharma) 2026年2月9日
「对我来说,很明显,是时候继续前进了,」夏尔马写道。
Sharma曾在Claude开发公司工作两年,主要负责防御人工智慧引发的生物威胁、内部问责工具以及早期人工智慧安全措施记录框架的研究。他还研究了聊天机器人如何强化用户偏见并逐步改变人类判断。
这位研究人员赞扬了前同事的技术水平和严谨的道德品质,但也暗示将不再从事企业人工智慧的工作。他宣布计划从事写作、私人辅导,并可能攻读诗歌方向的研究生学位。
在他离职之前,外界高度关注领先的人工智慧开发人员如何管理内部异议、揭露风险以及在快速提升能力与安全研究之间取得平衡。





