Mô hình AI Llama 3.1 mới của Meta miễn phí, mạnh mẽ và đầy rủi ro

avatar
WIRED
07-23
Bài viết này được dịch máy
Xem bản gốc

Hầu hết các ông trùm công nghệ đều hy vọng bán được trí tuệ nhân tạo cho đại chúng. Nhưng Mark Zuckerberg đang tặng miễn phí thứ mà Meta coi là một trong những mô hình AI tốt nhất thế giới.

Meta đã phát hành miễn phí phiên bản lớn nhất, có khả năng nhất của mô hình ngôn ngữ lớn có tên Llama vào thứ Hai. Meta chưa tiết lộ chi phí phát triển Llama 3.1 nhưng Zuckerberg mới đây đã nói với các nhà đầu tư rằng công ty của ông đang chi hàng tỷ USD cho việc phát triển AI.

Thông qua bản phát hành mới nhất này, Meta đang cho thấy rằng cách tiếp cận khép kín được hầu hết các công ty AI ưa chuộng không phải là cách duy nhất để phát triển AI. Nhưng công ty cũng đang đặt mình vào trung tâm của cuộc tranh luận xung quanh những nguy hiểm do phát hành AI mà không có sự kiểm soát. Meta huấn luyện Llama theo cách mặc định ngăn mô hình tạo ra kết quả có hại nhưng mô hình có thể được sửa đổi để loại bỏ các biện pháp bảo vệ đó.

Meta nói rằng Llama 3.1 thông minh và hữu ích như những sản phẩm thương mại tốt nhất từ ​​các công ty như OpenAI , GoogleAnthropic . Trong một số tiêu chuẩn nhất định để đo lường sự tiến bộ trong AI, Meta cho biết mô hình này là AI thông minh nhất trên Trái đất.

Percy Liang , phó giáo sư tại Đại học Stanford, người theo dõi AI nguồn mở, cho biết: “Thật thú vị”. Liang cho biết, nếu các nhà phát triển nhận thấy mô hình mới có khả năng tương đương với các mô hình hàng đầu trong ngành, bao gồm cả GPT-4o của OpenAI , thì có thể nhiều người sẽ chuyển sang sản phẩm của Meta. “Sẽ rất thú vị khi xem cách sử dụng thay đổi như thế nào,” ông nói.

Trong một bức thư ngỏ được đăng cùng với việc phát hành mô hình mới, CEO Zuckerberg của Meta đã so sánh Llama với hệ điều hành Linux nguồn mở. Khi Linux cất cánh vào cuối những năm 90 và đầu những năm 2000, nhiều công ty công nghệ lớn đã đầu tư vào các giải pháp thay thế đóng và chỉ trích phần mềm nguồn mở là rủi ro và không đáng tin cậy. Tuy nhiên, ngày nay Linux được sử dụng rộng rãi trong điện toán đám mây và đóng vai trò là cốt lõi của hệ điều hành di động Android.

“Tôi tin rằng AI sẽ phát triển theo cách tương tự,” Zuckerberg viết trong thư của mình. “Ngày nay, một số công ty công nghệ đang phát triển các mô hình khép kín hàng đầu. Nhưng nguồn mở đang nhanh chóng thu hẹp khoảng cách.”

Tuy nhiên, quyết định từ bỏ AI của Meta không phải là không có lợi cho bản thân. Các bản phát hành trước đây của Llama đã giúp công ty đảm bảo vị trí có ảnh hưởng trong số các nhà nghiên cứu, nhà phát triển và công ty khởi nghiệp AI. Liang cũng lưu ý rằng Llama 3.1 không thực sự là nguồn mở vì Meta áp đặt các hạn chế đối với việc sử dụng nó, ví dụ như giới hạn quy mô mà mô hình có thể được sử dụng trong các sản phẩm thương mại.

Phiên bản mới của Llama có 405 tỷ thông số hoặc các phần tử có thể điều chỉnh được. Meta đã phát hành hai phiên bản nhỏ hơn của Llama 3, một phiên bản có 70 tỷ thông số và một phiên bản khác có 8 tỷ thông số. Meta hôm nay cũng đã phát hành phiên bản nâng cấp của các mẫu này mang nhãn hiệu Llama 3.1.

Llama 3.1 quá lớn để có thể chạy trên máy tính thông thường nhưng Meta cho biết nhiều nhà cung cấp đám mây, bao gồm Databricks, Groq, AWS và Google Cloud, sẽ cung cấp các tùy chọn lưu trữ để cho phép các nhà phát triển chạy các phiên bản tùy chỉnh của mô hình. Mô hình này cũng có thể được truy cập tại Meta.ai.

Một số nhà phát triển cho biết bản phát hành Llama mới có thể có ý nghĩa sâu rộng đối với việc phát triển AI. Stella Biderman , giám đốc điều hành của EleutherAI , một dự án AI nguồn mở, cũng lưu ý rằng Llama 3 không phải là nguồn mở hoàn toàn. Nhưng Biderman lưu ý rằng việc thay đổi giấy phép mới nhất của Meta sẽ cho phép các nhà phát triển đào tạo mô hình của riêng họ bằng cách sử dụng Llama 3, điều mà hầu hết các công ty AI hiện đang cấm. Biderman nói: “Đây thực sự là một vấn đề lớn.

Không giống như OpenAI và các mô hình mới nhất của Google, Llama không phải là “đa phương thức”, nghĩa là nó không được xây dựng để xử lý hình ảnh, âm thanh và video. Nhưng Meta cho biết mô hình này tốt hơn đáng kể khi sử dụng các phần mềm khác như trình duyệt web, điều mà nhiều nhà nghiên cứu và công ty tin rằng có thể khiến AI trở nên hữu ích hơn .

Sau khi OpenAI phát hành ChatGPT vào cuối năm 2022, một số chuyên gia AI đã kêu gọi tạm dừng phát triển AI vì lo ngại công nghệ này có thể bị lạm dụng hoặc quá mạnh để có thể kiểm soát. Báo động hiện sinh đã nguội đi kể từ đó nhưng nhiều chuyên gia vẫn lo ngại rằng các mô hình AI không hạn chế có thể bị tin tặc lạm dụng hoặc sử dụng để tăng tốc độ phát triển vũ khí sinh học hoặc hóa học.

Geoffrey Hinton, người đoạt giải Turing, người có công trình tiên phong trong lĩnh vực học máy được gọi là học sâu, đã đặt nền móng cho các mô hình ngôn ngữ lớn, cho biết: “Tội phạm mạng ở khắp mọi nơi sẽ rất vui mừng”.

Hinton gia nhập Google vào năm 2013 nhưng đã rời công ty vào năm ngoái để lên tiếng về những rủi ro có thể xảy ra với các mô hình AI tiên tiến hơn. Ông nói rằng AI về cơ bản khác với phần mềm nguồn mở vì các mô hình không thể được xem xét kỹ lưỡng theo cùng một cách. Ông nói thêm: “Mọi người tinh chỉnh các mô hình cho mục đích riêng của họ và một số mục đích đó rất tệ”.

Meta đã giúp xoa dịu một số lo ngại bằng cách phát hành các phiên bản trước của Llama một cách cẩn thận. Công ty cho biết họ đã đưa Llama trải qua quá trình kiểm tra an toàn nghiêm ngặt trước khi phát hành và nói thêm rằng có rất ít bằng chứng cho thấy các mẫu của họ giúp việc phát triển vũ khí trở nên dễ dàng hơn. Meta cho biết họ sẽ phát hành một số công cụ mới để giúp các nhà phát triển giữ an toàn cho các mô hình Llama bằng cách kiểm duyệt đầu ra của họ và ngăn chặn các nỗ lực phá vỡ các hạn chế. Jon Carvill, phát ngôn viên của Meta, cho biết công ty sẽ quyết định từng trường hợp cụ thể xem có tung ra các mẫu máy trong tương lai hay không.

Dan Hendrycks, một nhà khoa học máy tính và là giám đốc Trung tâm An toàn AI , một tổ chức phi lợi nhuận tập trung vào các mối nguy hiểm của AI, cho biết Meta nhìn chung đã làm rất tốt việc thử nghiệm các mô hình của mình trước khi phát hành chúng. Ông nói rằng mô hình mới có thể giúp các chuyên gia hiểu được những rủi ro trong tương lai. “Bản phát hành Llama 3 hôm nay sẽ cho phép các nhà nghiên cứu bên ngoài các công ty công nghệ lớn tiến hành nghiên cứu an toàn AI rất cần thiết.”

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận