Anthropic bác bỏ lệnh cấm của chính phủ Mỹ đối với việc người nước ngoài sử dụng Fable 5.

Bài viết này được dịch máy
Xem bản gốc

Tác giả: Xiong Lei

Biên tập: Xu Qingyang

Vào ngày 12 tháng 6, theo giờ địa phương tại Hoa Kỳ, một cuộc đối đầu hiếm hoi giữa chính phủ và các doanh nghiệp trong lịch sử quản lý trí tuệ nhân tạo bất ngờ nổ ra vào thứ Sáu tuần này.

Với lý do lo ngại về an ninh quốc gia, chính phủ Hoa Kỳ đã ban hành lệnh kiểm soát xuất khẩu đối với Anthropic , yêu cầu đình chỉ ngay lập tức quyền truy cập vào các mô hình trí tuệ nhân tạo Fable 5 và Mythos 5 của công ty này đối với tất cả các thực thể nước ngoài. Lệnh này có phạm vi rất rộng, ảnh hưởng không chỉ đến người dùng nước ngoài bên ngoài Hoa Kỳ, mà còn cả công dân nước ngoài đang sinh sống tại Hoa Kỳ, và thậm chí cả nhân viên nước ngoài của Anthropic.

Để tuân thủ quy định, Anthropic buộc phải ngừng hoàn toàn quyền truy cập vào hai mô hình này đối với tất cả người dùng — đây hiện là giải pháp khả thi duy nhất để đảm bảo tuân thủ, vì về mặt kỹ thuật, công ty không thể phân biệt giữa nhóm người dùng "thực thể nước ngoài" và "công dân Hoa Kỳ". Quyền truy cập vào các mô hình khác của công ty vẫn không bị ảnh hưởng; người dùng sẽ tự động được chuyển về Claude Opus 4.8.

Việc dừng đột ngột này hoàn toàn bất ngờ. Fable 5 và Mythos 5 vừa được phát hành chính thức vào ngày 9 tháng 6, chỉ ba ngày trước. Việc đột ngột hủy niêm yết cả hai tựa game này đã gây ra cú sốc lớn trong giới công nghệ và cộng đồng trí tuệ nhân tạo.

01 Hai mô hình đó chính xác là gì?

Để hiểu được những mâu thuẫn cốt lõi trong cuộc tranh cãi này, trước tiên cần phải hiểu Fable 5 và Mythos 5 là loại mô hình nào, và tại sao chúng lại bị các cơ quan quản lý chú ý ngay từ đầu.

Mythos là dòng sản phẩm mới của Anthropic, vượt trội hơn sê-ri Opus về khả năng, đại diện cho cấp độ năng lực cao nhất mà Anthropic hiện có thể triển khai công khai. Mẫu sản phẩm tương tự Mythos đầu tiên, Claude Mythos Preview, đã được phát hành vào tháng 4 năm nay thông qua "Dự án Glasswing", với quyền truy cập bị giới hạn nghiêm ngặt chỉ dành cho một số ít đối tác, bởi vì khả năng của nó trong lĩnh vực an ninh mạng quá mạnh mẽ để có thể cung cấp rộng rãi.

Fable 5 là mô hình cấp độ Mythos đầu tiên được chính thức phát hành ra công chúng. Khả năng của nó vượt trội so với tất cả các mô hình đã được Anthropic phát hành trước đây, đạt hiệu suất hàng đầu trong hầu hết các bài kiểm tra, bao gồm kỹ thuật phần mềm, công việc trí tuệ, hiểu biết trực quan và nghiên cứu khoa học.

Để cho phép phát hành rộng rãi, Anthropic đã trang bị cho Fable 5 một cơ chế bảo mật chuyên dụng—trong các lĩnh vực rủi ro cao như an ninh mạng, sinh học và hóa học, mô hình sẽ tự động chặn các phản hồi và chuyển sang xử lý bằng Claude Opus 4.8.

Mythos 5 là phiên bản được xây dựng trên cùng một mô hình cơ bản nhưng có mức độ bảo mật thấp hơn. Nó chỉ dành cho các tổ chức được phê duyệt đã từng được cấp quyền truy cập vào Project Glasswing và được định vị là một công cụ chuyên nghiệp dành cho các nhà bảo vệ an ninh mạng và các nhà điều hành cơ sở hạ tầng trọng yếu. Cả hai mô hình đều có cùng mức giá: 10 đô la cho mỗi triệu token đầu vào và 50 đô la cho mỗi triệu token đầu ra.

02 Yếu tố kích hoạt lệnh

Theo các báo cáo, Bộ trưởng Thương mại Hoa Kỳ Howard Lutnick đã gửi thư cho Giám đốc điều hành của Anthropic, Dario Amodei, vào ngày 12 tháng 6, thông báo rằng Mythos 5 và Fable 5 sẽ phải chịu sự kiểm soát xuất khẩu. Nguyên nhân trực tiếp dẫn đến quyết định này là do một công ty khác tuyên bố có thể "bẻ khóa" Mythos, làm dấy lên lo ngại trong chính quyền Trump về rủi ro an ninh quốc gia tiềm tàng.

Được biết, chính quyền Trump trước đó đã cố gắng ngăn chặn Anthropic tung ra hai mẫu xe này, nhưng không thành công – điều này thúc đẩy chính quyền sau đó áp dụng biện pháp kiểm soát xuất khẩu nghiêm ngặt hơn.

Đối diện mệnh lệnh đột ngột này, Anthropic, trong khi tuân thủ các quy định, đã đưa ra một tuyên bố dài với ngôn từ mạnh mẽ bất thường, bác bỏ một cách có hệ thống lý lẽ của chính phủ.

Anthropic cho rằng rằng bằng chứng "bẻ khóa" mà chính phủ nắm giữ chỉ liên quan đến một phương pháp tấn công rất hẹp và không mang tính tổng quát, về cơ bản yêu cầu mô hình phải đọc một cơ sở mã cụ thể và sửa các lỗ hổng phần mềm trong đó— những khả năng tương tự cũng tồn tại trong các mô hình khác được công khai, bao gồm OpenAI GPT-5.5, và được các chuyên gia an ninh mạng sử dụng hàng ngày để bảo trì hệ thống thông thường.

Trong tuyên bố của mình, Anthropic đã nêu rõ rằng việc sử dụng "sự tồn tại của một số lượng hạn chế các lỗ hổng bảo mật tiềm năng" làm tiêu chuẩn để thu hồi các mô hình kinh doanh đã triển khai sẽ khiến toàn bộ quá trình triển khai các mô hình tiên tiến mới trong toàn ngành bị đình trệ hoàn toàn. Công ty cũng nhấn mạnh rằng hành động lần chính phủ không tuân theo các thủ tục pháp lý bắt buộc về tính minh bạch, công bằng và dựa trên các bằng chứng kỹ thuật, như đã được công khai kêu gọi trước đó.

Anthropic tuyên bố sẽ tuân thủ các chỉ thị hợp pháp của chính phủ và đang tích cực liên lạc với chính phủ để khôi phục quyền truy cập sớm nhất có thể. Thông tin chi tiết về mặt kỹ thuật sẽ được công bố trong vòng 24 giờ tới. Công ty cho rằng sự cố lần xuất phát từ sự hiểu lầm và thành thật xin lỗi vì bất kỳ sự bất tiện nào gây ra cho người dùng.

Sau đây là toàn văn tuyên bố do Anthropic đưa ra có tiêu đề "Liên quan đến lệnh của Chính phủ Hoa Kỳ về việc đình chỉ quyền truy cập vào Fable 5 và Mythos 5":

Dựa trên ủy quyền an ninh quốc gia, chính phủ Hoa Kỳ đã ban hành chỉ thị kiểm soát xuất khẩu yêu cầu đình chỉ quyền truy cập vào Fable 5 và Mythos 5 đối với tất cả công dân nước ngoài, bất kể họ đang ở trong hay ngoài Hoa Kỳ, bao gồm cả nhân viên nước ngoài của Anthropic. Trên thực tế, chỉ thị này buộc chúng tôi phải ngay lập tức ngừng truy cập Fable 5 và Mythos 5 đối với tất cả người dùng để đảm bảo tuân thủ. Các mô hình khác của Anthropic không bị ảnh hưởng.

Chúng tôi nhận được chỉ thị lúc 5:21 chiều giờ ET hôm nay. Lá thư không nêu rõ bất kỳ mối lo ngại nào về an ninh quốc gia. Theo hiểu biết của chúng tôi, chính phủ cho rằng họ đã nắm vững một phương pháp để vượt qua các biện pháp bảo mật của Fable 5, một kỹ thuật được gọi là "bẻ khóa" (jailbreak). Chúng tôi đã xem xét một bản trình diễn về kỹ thuật này và thấy rằng nó chỉ có thể xác định được một số ít lỗ hổng nhỏ đã được biết đến trước đó. Những lỗ hổng này tương đối đơn giản, và các mô hình khác có sẵn trên thị trường có thể phát hiện ra các vấn đề tương tự mà không cần bẻ khóa.

Trong một bài đăng trên blog được Fable công bố, Anthropic đã nêu rõ lập trường của chúng tôi về các biện pháp bảo mật như sau:

Chúng tôi đã thiết lập một cơ chế bảo mật mạnh mẽ giúp giảm đáng kể khả năng Fable bị lạm dụng cho mục đích an ninh mạng và nhiệm vụ liên quan. Trên thực tế, một số người dùng đã nhận xét rằng các biện pháp bảo vệ của chúng tôi quá nghiêm ngặt.

Trong những tuần trước khi Fable được phát hành, Anthropic đã hợp tác với chính phủ Hoa Kỳ, Viện An ninh AI của Anh, nhiều tổ chức bên thứ ba và đội ngũ nội bộ của mình để tiến hành hàng nghìn giờ thử nghiệm tấn công mô phỏng (red team testing) về bảo mật của Fable. Kết quả thử nghiệm cho thấy bảo mật của Fable vượt trội hơn đáng kể so với bất kỳ mô hình nào đã được triển khai trước đó.

Hiện tại, chưa có chuyên gia nào tìm ra phương pháp"bẻ khóa toàn diện" — tức là phương pháp bẻ khóa có thể hoàn toàn vượt qua các biện pháp bảo vệ an ninh của thiết bị và mở khóa khả năng tấn công mạng quy mô lớn.

Chúng tôi cho rằng rằng hiện tại không có nhà cung cấp mô hình nào có thể đạt được khả năng bảo vệ chống bẻ khóa hoàn hảo. Tất cả các cơ chế bảo vệ tiêu chuẩn ngành đều dễ bị xâm phạm bởi "các phương pháp bẻ khóa không phổ quát" (tức là thu thập thông tin mạng một phần trong những trường hợp cụ thể), và phương pháp bẻ khóa phổ quát có thể xuất hiện trong tương lai. Chúng tôi đã nêu rõ điểm này khi Fable 5 được phát hành.

Do việc bảo vệ hoàn hảo khỏi các cuộc tấn công bẻ khóa (jailbreak) hiện nay là không khả thi, Anthropic đã áp dụng chiến lược phòng thủ nhiều lớp cho Fable 5. Mục tiêu của chúng tôi là làm cho các cuộc tấn công bẻ khóa có phạm vi cực kỳ hẹp (đối với các cuộc tấn công bẻ khóa không phổ biến) hoặc cực kỳ tốn kém (đối với các cuộc tấn công bẻ khóa phổ biến), kết hợp với việc giám sát toàn diện để nhanh chóng phát hiện và ngăn chặn bất kỳ cuộc tấn công thành công nào. Đây cũng là lý do tại sao Anthropic yêu cầu dữ liệu khách hàng được lưu giữ trong 30 ngày — mặc dù chính sách này có tác động thực sự đến mối quan hệ khách hàng của chúng tôi, nhưng nó giúp chúng tôi nghiên cứu và giải quyết rủi ro bẻ khóa.

Chúng tôi tuân thủ chiến lược phòng thủ nhiều lớp này. Chiến lược này giúp giảm thiểu hiệu quả rủi ro liên quan đến Fable, đưa chúng xuống rủi ro tương đương với các mô hình đã được triển khai hiện có trong ngành.

Cho đến nay, chúng tôi thậm chí chưa nhận được bất kỳ thông báo chính thức nào về các vụ bẻ khóa không mang tính phổ biến có thể gây ra hậu quả nguy hại. Các trường hợp bẻ khóa tiềm năng được tiết lộ cho chúng tôi đều hoàn toàn vô hại hoặc chỉ là những phát hiện nhỏ không chứng minh được khả năng độc quyền của Mythos.

Hiện tại, chính phủ Hoa Kỳ chỉ cung cấp cho chúng tôi bằng chứng bằng lời nói về một phương pháp bẻ khóa tiềm năng, có phạm vi hạn chế và không mang tính tổng quát, về cơ bản yêu cầu mô hình đọc một cơ sở mã cụ thể và sửa các lỗ hổng phần mềm trong đó . Theo hiểu biết của chúng tôi, phương pháp bẻ khóa tiềm năng này đã được chia sẻ với chính phủ. Chúng tôi đã xem xét báo cáo báo cáo— mà chúng tôi cho rằng là cơ sở cho chỉ thị của chính phủ — và xác minh rằng mức độ khả năng được mô tả trong báo cáo cũng phổ biến trong các mô hình khác (bao gồm cả GPT-5.5 của OpenAI) và được các chuyên gia an ninh mạng sử dụng hàng ngày để duy trì an ninh hệ thống. Chúng tôi sẽ công bố thêm chi tiết trong vòng 24 giờ tới.

Chúng tôi sẽ tuân thủ chỉ thị hợp pháp của chính phủ về việc vô hiệu hóa quyền truy cập vào Fable 5 và Mythos 5 đối với tất cả người dùng. Tuy nhiên, chúng tôi không đồng ý rằng việc phát hiện ra một phương pháp bẻ khóa tiềm năng có phạm vi hạn chế là đủ căn cứ để thu hồi một mô hình thương mại đã được triển khai cho hàng trăm triệu người dùng. Áp dụng tiêu chuẩn này cho toàn bộ ngành công nghiệp sẽ khiến tất cả các nhà cung cấp mô hình hàng đầu rơi vào tình trạng đình trệ hoàn toàn trong việc triển khai các mô hình mới.

Chúng tôi đã công khai tuyên bố rằng các chính phủ nên có quyền ngăn chặn việc triển khai các mô hình không an toàn thông qua các thủ tục pháp lý minh bạch, công bằng, rõ ràng và dựa trên cơ sở kỹ thuật. Hành động lần đã không tuân theo các nguyên tắc đó.

Chúng tôi thành thật xin lỗi vì bất kỳ sự bất tiện nào đã gây ra cho người dùng. Chúng tôi cho rằng sự cố lần xuất phát từ sự hiểu lầm và đang tích cực làm việc để khôi phục quyền truy cập trong thời gian sớm nhất.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận