人类安全保障负责人辞职,并警告人工智慧安全危机日益加剧

本文为机器翻译
展示原文

领导 Anthropic 安全保障研究的 Mrinank Sharma 昨天从这家人工智慧公司辞职,并公开了他的离职信。

在发布给X的信中,夏尔马指出,人工智慧组织以及更广泛的社会中,其宣称的原则与实际决策之间存在差距,这令人日益不安。他描述了伦理承诺与实际操作之间日益扩大的脱节。

今天是我在Anthropic的最后一天。我辞职了。

这是我写给同事们的信,解释了我的决定。 pic.twitter.com/Qe4QyAFmxL

— mrinank (@MrinankSharma) 2026年2月9日

「对我来说,很明显,是时候继续前进了,」夏尔马写道。

Sharma曾在Claude开发公司工作两年,主要负责防御人工智慧引发的生物威胁、内部问责工具以及早期人工智慧安全措施记录框架的研究。他还研究了聊天机器人如何强化用户偏见并逐步改变人类判断。

这位研究人员赞扬了前同事的技术水平和严谨的道德品质,但也暗示将不再从事企业人工智慧的工作。他宣布计划从事写作、私人辅导,并可能攻读诗歌方向的研究生学位。

在他离职之前,外界高度关注领先的人工智慧开发人员如何管理内部异议、揭露风险以及在快速提升能力与安全研究之间取得平衡。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
69
收藏
19
评论