Claude Mythos phiên bản người máy: Mối đe dọa nghiêm trọng hay chỉ là thổi phồng quá mức? Viện An ninh AI đưa ra nhận định.

avatar
Decrypt
04-14
Bài viết này được dịch máy
Xem bản gốc

Viện An ninh AI của Anh đã đánh giá Claude Mythos Preview của Anthropic để xem xét khả năng an ninh mạng được cho là vượt trội của nó, và nhận thấy mô hình AI này có thể tự động thực hiện các cuộc tấn công mạng tinh vi với tỷ lệ thành công chưa từng có.

Sự tồn tại của Claude Mythos lần đầu tiên được tiết lộ vào cuối tháng 3 thông qua một vụ rò rỉ trang web, với việc Anthropic xác nhận rằng mô hình thế hệ tiếp theo mạnh mẽ này có khả năng tìm kiếm và khai thác các lỗ hổng an ninh mạng ở mức độ chưa từng thấy trước đây bởi bất kỳ mô hình AI nào hiện có. Nó được cho là đã tìm thấy các lỗ hổng nghiêm trọng trong các trình duyệt web và hệ điều hành hiện tại.

Thay vì công khai mô hình này, Anthropic đã cung cấp quyền truy cập hạn chế cho hàng chục công ty nghiên cứu bảo mật để thử nghiệm và chuẩn bị cho các khả năng tiên tiến của nó. Tuần trước, Bộ trưởng Treasury Hoa Kỳ Scott Bessent và Chủ tịch Cục Dự trữ Liên bang Jerome Powell được cho là đã cảnh báo các giám đốc ngân hàng về mối đe dọa an ninh tiềm tàng do Claude Mythos gây ra.

Kết quả thử nghiệm của Viện An ninh AI, được công bố hôm thứ Hai, cho thấy những lời quảng cáo thổi phồng là hoàn toàn có cơ sở. Đánh giá cho thấy Mythos Preview đã thành công 73% trong các nhiệm vụ "bắt cờ" cấp độ chuyên gia - những thử thách mà không mô hình AI nào có thể hoàn thành trước tháng 4 năm 2025, theo báo cáo.

Mối đe dọa này có thể rất đáng kể và lan rộng, mặc dù công nghệ này có thể được sử dụng để tìm và khắc phục các lỗ hổng, chứ không chỉ để khai thác chúng. Đối với các nhà điều hành cơ sở hạ tầng tiền điện tử, những khả năng AI tiên tiến như vậy đại diện cho một loại mối đe dọa an ninh tiềm tàng mới khi các hệ thống AI có được khả năng tự động dò xét và khai thác các lỗ hổng mạng.

Theo Viện An ninh AI, Mythos Preview đã trở thành mô hình AI đầu tiên hoàn thành "The Last Ones" (TLO) - một bài mô phỏng tấn công mạng doanh nghiệp gồm 32 bước, thường cần con người mất 20 giờ để hoàn thành. Mô hình đã thành công trong 3 trên 10 lần thử, trung bình hoàn thành 22 trên 32 bước trong tất cả các lần chạy.

Quá trình mô phỏng bao gồm từ giai đoạn trinh sát ban đầu đến việc chiếm quyền kiểm soát toàn bộ mạng lưới, mô phỏng các vụ xâm nhập doanh nghiệp trong thế giới thực. Claude Opus 4.6, mô hình có hiệu suất tốt thứ hai, chỉ mất trung bình 16 bước. Viện nghiên cứu của Anh lưu ý rằng hiệu suất của Mythos Preview tiếp tục tăng lên khi tài nguyên tính toán được nâng cao, sử dụng tới 100 triệu token cho mỗi lần chạy đánh giá.

Khi được chỉ đạo rõ ràng và được cấp quyền truy cập mạng trong các đánh giá có kiểm soát, mô hình đã chứng minh khả năng thực hiện các cuộc tấn công nhiều giai đoạn và phát hiện các lỗ hổng mà không cần sự hướng dẫn của con người.

Bước tiến này đánh dấu một sự leo thang ngoạn mục so với chỉ hai năm trước, khi các mô hình AI còn gặp khó khăn với các bài tập an ninh mạng cơ bản. Viện An toàn AI của Anh, đơn vị đã theo dõi những khả năng này từ năm 2023, đã ghi nhận sự tiến bộ nhanh chóng này, từ các nhiệm vụ ở cấp độ người mới bắt đầu đến các cuộc tấn công tự động ở cấp độ chuyên gia.

Đối với hệ sinh thái tiền điện tử, nơi các lỗ hổng hợp đồng thông minhcác vụ tấn công sàn giao dịch đã gây thiệt hại hàng tỷ đô la mỗi năm, các cuộc tấn công dựa trên trí tuệ nhân tạo có thể khuếch đại các rủi ro hiện có. Các giao thức tài chính phi tập trung (DeFi) , thường dựa vào các hệ thống liên kết phức tạp, có thể phải đối mặt với nguy cơ đặc biệt cao trước các nỗ lực khai thác tự động có khả năng phân tích và tấn công nhiều hướng cùng một lúc.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
68
Thêm vào Yêu thích
18
Bình luận