Đây là những gì sẽ xảy ra tiếp theo khi mô hình AI mạnh nhất của Anthropic bị rò rỉ thông qua bộ nhớ đệm dữ liệu không được bảo mật.

Bài viết này được dịch máy
Xem bản gốc

Anthropic đang thử nghiệm mô hình trí tuệ nhân tạo mạnh mẽ nhất mà họ từng xây dựng, và thế giới lẽ ra chưa được biết điều đó.

Một vụ rò rỉ dữ liệu được tạp chí Fortune đưa tin hôm thứ Năm tiết lộ rằng phòng thí nghiệm trí tuệ nhân tạo đứng sau Claude đã huấn luyện một mô hình mới có tên "Mythos", mà họ mô tả nội bộ là "mô hình trí tuệ nhân tạo mạnh mẽ nhất mà chúng tôi từng phát triển".

Mô hình này được phát hiện trong một bản nháp bài đăng trên blog được lưu trữ trong kho dữ liệu không được bảo mật và có thể tìm kiếm công khai, cùng với gần 3.000 tài sản chưa được công bố khác, theo các nhà nghiên cứu an ninh mạng đã xem xét tài liệu này.

Sau khi tạp chí Fortune đặt câu hỏi, Anthropic đã xác nhận sự tồn tại của mô hình này, gọi đó là "một bước tiến đột phá" về hiệu năng AI và "mô hình có khả năng nhất mà chúng tôi từng xây dựng". Công ty cho biết mô hình đang được thử nghiệm bởi "các khách hàng được tiếp cận sớm" và thừa nhận rằng "lỗi của con người" trong hệ thống quản lý nội dung của họ đã gây ra sự rò rỉ.

Bài đăng blog nháp giới thiệu một dòng sản phẩm mới có tên "Capybara", được mô tả là lớn hơn và mạnh mẽ hơn các dòng Opus hiện có của Anthropic, vốn trước đây là những mẫu mạnh nhất của hãng.

"So với mô hình tốt nhất trước đây của chúng tôi, Claude Opus 4.6, Capybara đạt điểm cao hơn đáng kể trong các bài kiểm tra về lập trình phần mềm, tư duy học thuật và an ninh mạng, cùng nhiều lĩnh vực khác," bản dự thảo cho biết.

Khía cạnh an ninh mạng là yếu tố quan trọng nhất đối với ngành công nghiệp tiền điện tử. Bản nháp bài đăng trên blog cho biết mô hình này "tiềm ẩn những rủi ro an ninh mạng chưa từng có", một cách diễn đạt có tác động trực tiếp đến an ninh blockchain, kiểm toán hợp đồng thông minh và cuộc chạy đua vũ trang leo thang giữa kẻ tấn công và người phòng thủ trong DeFi.

Chỉ riêng trong tuần này, Ripple đã công bố một cuộc đại tu bảo mật dựa trên trí tuệ nhân tạo (AI) cho XRP Ledger sau khi một nhóm tấn công giả lập (red team) được hỗ trợ bởi AI phát hiện ra hơn 10 lỗ hổng trong mã nguồn đã 13 năm tuổi của nó. Ethereum cũng ra mắt một trung tâm bảo mật hậu lượng tử chuyên dụng được hỗ trợ bởi tám năm nghiên cứu.

Và đồng tiền ổn định Resolv đã mất Neo sau khi kẻ tấn công khai thác lỗ hổng trong hợp đồng đúc tiền không có kiểm tra oracle và kiểm soát truy cập bằng một khóa duy nhất, một loại lỗi cơ sở hạ tầng mà các công cụ AI tiên tiến hơn có thể phát hiện ra trước khi kẻ tấn công làm được, hoặc khai thác nhanh hơn khả năng phản ứng của bên phòng thủ.

Đối với thị trường Token AI, vụ rò rỉ này đặt ra một câu hỏi khác. Mạng lưới phi tập trung của Bittensor gần đây đã phát hành Covenant-72B, một mô hình cạnh tranh với Llama 2 70B của Meta, gây ra đợt tăng giá 90% của TAO và đẩy tổng vốn hóa thị trường của các token mạng con lên 1,47 tỷ đô la.

Một "bước đột phá" từ một phòng thí nghiệm tập trung như Anthropic đã thiết lập lại tiêu chuẩn mà các dự án AI phi tập trung cần phải đáp ứng. Khoảng cách cạnh tranh giữa những gì một phòng thí nghiệm doanh nghiệp được đầu tư mạnh có thể xây dựng và những gì một mạng lưới Không cần cho phép có thể tạo ra ngày càng rộng hơn.

Anthropic cho biết họ đang "cân nhắc kỹ lưỡng" về việc phát hành mô hình này, xét đến khả năng của nó. Bản nháp bài đăng trên blog lưu ý rằng mô hình này tốn kém để vận hành và chưa sẵn sàng để sử dụng rộng rãi. Công ty đã gỡ bỏ quyền truy cập công khai vào kho dữ liệu sau khi Fortune liên hệ với họ.

Vụ rò rỉ này tự nó đã là một bài học cảnh tỉnh. Một công ty đang xây dựng cái mà họ mô tả là mô hình trí tuệ nhân tạo với khả năng an ninh mạng chưa từng có đã vô tình để lộ thông tin về mô hình đó trong một kho dữ liệu không được bảo mật, có thể tìm kiếm công khai do lỗi của con người. Sự trớ trêu ở đây thì không cần phải giải thích thêm.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
77
Thêm vào Yêu thích
17
Bình luận