GPT-5.5 của OpenAI sánh ngang với Claude Mythos về khả năng tấn công mạng: Viện An ninh Trí tuệ Nhân tạo

Bài viết này được dịch máy

Xem bản gốc

Một cơ quan chính phủ Anh đã phát hiện ra rằng mô hình trí tuệ nhân tạo mới nhất của OpenAI có thể tự động thực hiện các cuộc tấn công mạng phức tạp—và nó đã giải mã được một bài toán đảo ngược kỹ thuật chỉ trong hơn 10 phút, trong khi một chuyên gia an ninh mạng phải mất khoảng 12 giờ mới làm được.

Viện An ninh Trí tuệ Nhân tạo (AISI), một cơ quan nghiên cứu thuộc Bộ Khoa học, Đổi mới và Công nghệ của Anh, đã công bố các phát hiện hôm thứ Năm cho thấy GPT-5.5 nằm trong số những mô hình mạnh nhất mà họ đã đánh giá về khả năng tấn công mạng, ngang tầm với Claude Mythos nổi tiếng của Anthropic.

Báo cáo cho thấy GPT-5.5 là mô hình thứ hai hoàn thành bài kiểm tra khắt khe nhất của AISI – một cuộc tấn công mạng doanh nghiệp mô phỏng gồm 32 bước có tên gọi "The Last Ones" – và thực hiện thành công một cách tự động trong 2 trên 10 lần thử. Mô hình đầu tiên đạt được cột mốc này là Claude Mythos Preview của Anthropic, hoàn thành mô phỏng trong 3 trên 10 lần thử.

Hệ thống mô phỏng mạng doanh nghiệp, được xây dựng với sự hợp tác của công ty an ninh mạng SpecterOps, yêu cầu một tác nhân phải thực hiện chuỗi các bước bao gồm trinh sát, đánh cắp thông tin đăng nhập, di chuyển ngang qua nhiều rừng Active Directory, chuyển hướng chuỗi cung ứng thông qua đường ống CI/CD, và cuối cùng là đánh cắp dữ liệu từ cơ sở dữ liệu nội bộ được bảo vệ — những bước mà AISI ước tính một chuyên gia con người sẽ mất khoảng 20 giờ để thực hiện.

Có lẽ kết quả ấn tượng nhất liên quan đến một bài toán đảo ngược kỹ thuật cực kỳ khó. GPT-5.5 đã giải quyết thử thách này—yêu cầu tái tạo tập lệnh của một máy ảo tùy chỉnh, viết trình dịch ngược từ đầu và khôi phục mật khẩu mã hóa thông qua giải quyết ràng buộc—trong 10 phút 22 giây, với chi phí sử dụng API là 1,73 đô la. Một chuyên gia con người, sử dụng các công cụ chuyên nghiệp, cần khoảng 12 giờ.

Trên bộ bài kiểm tra an ninh mạng nâng cao của AISI, GPT-5.5 đạt tỷ lệ đậu trung bình 71,4% ở cấp độ "Chuyên gia" khó nhất, vượt trội hơn Mythos Preview với 68,6% và cao hơn đáng kể so với GPT-5.4 ở mức 52,4%.

Những phát hiện này mang ý nghĩa quan trọng đối với định hướng phát triển rộng hơn của trí tuệ nhân tạo. AISI kết luận rằng hiệu năng của GPT-5.5 cho thấy sự cải thiện nhanh chóng về năng lực an ninh mạng có thể là một phần của xu hướng chung chứ không phải là một bước đột phá riêng lẻ—và cảnh báo rằng nếu kỹ năng tấn công mạng đang nổi lên như một sản phẩm phụ của những cải tiến rộng hơn về khả năng suy luận, lập trình và hoàn thành nhiệm vụ tự động, thì những tiến bộ tiếp theo có thể đến rất nhanh.

Báo cáo cũng chỉ ra những lo ngại đáng kể về các biện pháp bảo vệ an toàn của mô hình. Các nhà nghiên cứu đã xác định được một lỗ hổng bảo mật phổ biến có thể tạo ra nội dung độc hại trên tất cả các truy vấn mạng độc hại được thử nghiệm, bao gồm cả trong các thiết lập tác nhân đa lượt. Cuộc tấn công này mất sáu giờ để các chuyên gia phát triển và phân tích. Sau đó, OpenAI đã cập nhật hệ thống bảo vệ của mình, mặc dù một vấn đề về cấu hình đã ngăn AISI xác minh liệu phiên bản cuối cùng có hiệu quả hay không.

AISI cảnh báo rằng các đánh giá khả năng của họ được tiến hành trong môi trường nghiên cứu được kiểm soát và không nhất thiết phản ánh những gì người dùng thông thường có thể tiếp cận, đồng thời lưu ý rằng các triển khai công cộng bao gồm các biện pháp bảo vệ và kiểm soát truy cập bổ sung.

Báo cáo này được công bố trong bối cảnh đáng lo ngại đối với an ninh mạng của Anh. Khảo sát về các vụ vi phạm an ninh mạng thường niên của chính phủ Anh , cũng được công bố hôm thứ Năm, cho thấy 43% doanh nghiệp đã phải chịu một vụ vi phạm hoặc tấn công mạng trong 12 tháng qua.

Đáp lại, chính phủ đã công bố khoản tài trợ mới trị giá 90 triệu bảng Anh để tăng cường khả năng chống chịu trước các mối đe dọa mạng, và cho biết họ đang tiếp tục thúc đẩy Dự luật An ninh mạng và Khả năng chống chịu để bảo vệ các dịch vụ thiết yếu. Các quan chức cũng đã công bố hướng dẫn kêu gọi các tổ chức chuẩn bị cho sự gia tăng tiềm tàng các lỗ hổng phần mềm mới được phát hiện khi trí tuệ nhân tạo (AI) đẩy nhanh tốc độ tìm kiếm và khai thác các lỗ hổng bảo mật.

Khu vực:

Metaverse

AI Tạo Sinh

Binance Launchpool

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan