Các biện pháp bảo vệ do con người gây ra dẫn đến việc từ chức, cảnh báo về cuộc khủng hoảng an toàn AI ngày càng gia tăng.

Bài viết này được dịch máy
Xem bản gốc

Ông Mrinank Sharma, người đứng đầu bộ phận nghiên cứu về bảo mật tại Anthropic, đã từ chức khỏi công ty trí tuệ nhân tạo này vào ngày hôm qua và công khai chia sẻ thư từ chức của mình.

Trong bức thư gửi cho X, Sharma đã nêu lên mối lo ngại ngày càng tăng về khoảng cách giữa các nguyên tắc đã nêu và các quyết định thực tế tại các tổ chức AI và trong xã hội nói chung. Ông mô tả sự mất kết nối ngày càng lớn giữa các cam kết đạo đức và thực tế hoạt động.

Hôm nay là ngày cuối cùng của tôi tại Anthropic. Tôi đã nghỉ việc.

Đây là bức thư tôi đã chia sẻ với các đồng nghiệp, giải thích quyết định của mình. pic.twitter.com/Qe4QyAFmxL

— mrinank (@MrinankSharma) 9 tháng 2 năm 2026

“Tôi hiểu rõ rằng đã đến lúc phải bước tiếp,” Sharma viết.

Sharma đã dành hai năm làm việc tại công ty phát triển phần mềm Claude, nơi anh nghiên cứu về hệ thống phòng thủ chống lại các mối đe dọa sinh học do trí tuệ nhân tạo (AI) cung cấp, các công cụ giám sát nội bộ và các khuôn khổ ban đầu để ghi chép các biện pháp an toàn AI. Anh cũng nghiên cứu cách chatbot có thể củng cố định kiến ​​của người dùng và dần dần định hình lại phán đoán của con người.

Nhà nghiên cứu đã ca ngợi các đồng nghiệp cũ về kỹ năng chuyên môn và sự nghiêm túc trong đạo đức, nhưng cũng báo hiệu sự chuyển hướng khỏi công việc trí tuệ nhân tạo trong doanh nghiệp. Ông tuyên bố kế hoạch theo đuổi viết lách, huấn luyện cá nhân và có thể là nghiên cứu sau đại học về thơ ca.

Sự ra đi của ông diễn ra sau một thời kỳ dư luận đặc biệt chú ý đến cách các nhà phát triển AI hàng đầu quản lý sự bất đồng nội bộ, tiết lộ rủi ro và cân bằng giữa việc đạt được những tiến bộ nhanh chóng về khả năng với nghiên cứu an toàn.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
69
Thêm vào Yêu thích
19
Bình luận