Meta tiết lộ Llama-3—Chúng tôi đưa mô hình AI nguồn mở hàng đầu mới vào thử nghiệm

Bài viết này được dịch máy
Xem bản gốc

Meta đã phát hành Llama 3, mô hình ngôn ngữ lớn nguồn mở tiên tiến nhất hiện có. Nó được xây dựng dựa trên nền tảng được đặt ra bởi người tiền nhiệm của nó, Llama 2, và thật bất ngờ khi có những tin đồn cho rằng việc phát hành sẽ diễn ra vào tháng tới .

Với nguồn gốc nguồn mở, Llama-2 là công cụ phát triển đồng thời các mô hình mạnh mẽ khác như Mixtral , Alpaca, Vicuna và WizardLM. Giờ đây, Llama-3 hứa hẹn sẽ đưa những khả năng này đi xa hơn nữa, cung cấp các chức năng tương đương với chức năng của mẫu AI hàng đầu hiện tại của OpenAI là GPT-4.

Meta ca ngợi bản phát hành hôm thứ Năm là “thế hệ tiếp theo của mô hình ngôn ngữ lớn nguồn mở tiên tiến nhất của chúng tôi”. Gã khổng lồ công nghệ rất tự tin vào khả năng của mình, Llama 3 đang hỗ trợ Meta AI , từ đó đã được thêm vào hầu hết các ứng dụng phổ biến rộng rãi của công ty: Instagram, Facebook và WhatsApp. Nó đã được cung cấp ở một số quốc gia chọn lọc, nhưng người dùng ở các khu vực khác có thể truy cập nó qua VPN.

Giao diện Chatbot của Meta AI có thể so sánh với ChatGPT Plus—và hoàn toàn miễn phí.

Mark Zuckerberg cho biết trong một bài đăng trên Facebook: “Chúng tôi đang nâng cấp Meta AI bằng mô hình AI Llama 3 hiện đại mới mà chúng tôi đang cung cấp nguồn mở”. “Với mô hình mới này, chúng tôi tin rằng Meta AI hiện là trợ lý AI thông minh nhất mà bạn có thể thoải mái sử dụng.”

Decrypt đã có thể thử nghiệm AI mới và nhận thấy nó có khả năng tương đương ChatGPT-Plus mà không cần đăng ký trả phí. Nó có thể tạo ra hình ảnh và hoạt ảnh, tạo mã và cung cấp các phản hồi mạch lạc, phù hợp với ngữ cảnh. Chatbot mới cũng có thể truy cập internet nhưng vẫn chưa thể sánh được với khả năng của các giải pháp chuyên dụng như Perplexity.

Có lẽ nhược điểm duy nhất là cửa sổ ngữ cảnh hiện tại của Llama-3 bị giới hạn ở 8K mã thông báo —khoảng 6.000 từ.

Meta đã phát hành mô hình Llama-3 có 70 tỷ tham số, nhưng việc sử dụng nó sẽ đòi hỏi sức mạnh tính toán lớn—có thể là toàn bộ giá GPU. Theo điểm chuẩn tổng hợp, model này đánh bại Gemini 1.5 Pro và Claude 3 Sonnet.

Ngoài ra còn có sẵn một mô hình tham số 8 tỷ, có thể chạy cục bộ trên GPU cấp độ người tiêu dùng. Cái này đánh bại Gemma và Mistral 7B của Google ở ​​nhiều điểm chuẩn tổng hợp khác nhau. Mô hình này vẫn chưa được liệt kê trong LLM Arena nên chưa có điểm ELO chủ quan để báo cáo.

Cả hai mô hình cũng có thể chạy trong phiên bản đám mây với chi phí thấp hơn.

Meta tuyên bố: “Chúng tôi tận tâm phát triển Llama 3 một cách có trách nhiệm và chúng tôi cũng đang cung cấp nhiều tài nguyên khác nhau để giúp những người khác sử dụng nó một cách có trách nhiệm”. Điều này bao gồm việc giới thiệu các công cụ an toàn và tin cậy mới như Llama Guard 2, Code Shield và CyberSec Eval 2.

Trong những tháng tới, Meta cho biết họ có kế hoạch giới thiệu các khả năng mới, cửa sổ ngữ cảnh dài hơn, kích thước mô hình bổ sung và hiệu suất nâng cao. Bài nghiên cứu về Llama 3 cũng sẽ được chia sẻ.

"Meta AI, được xây dựng bằng công nghệ Llama 3, hiện là một trong những trợ lý AI hàng đầu thế giới có thể tăng cường trí thông minh và giảm bớt gánh nặng cho bạn—giúp bạn học hỏi, hoàn thành công việc, tạo nội dung và kết nối để tận dụng tối đa mọi khoảnh khắc "Meta nói.

Meta nói thêm rằng họ cũng đang đào tạo một mô hình tham số khổng lồ 400 tỷ, dự kiến ​​sẽ được phát hành vào cuối năm nay. Mô hình này—có thể so sánh với Claude Opus hoặc phiên bản mới nhất của GPT-4.5— có thể là mô hình nguồn mở mạnh mẽ nhất cho đến nay. Nếu Lịch sử lặp lại, nó cũng sẽ đóng vai trò là cơ sở cho một thế hệ mô hình được tinh chỉnh mới sẽ đánh bại Llama-3 về chất lượng tổng thể—và sẽ thúc đẩy sự cạnh tranh với các mô hình nguồn gần hàng đầu.

Decrypt đã thử nghiệm Llama-3 bên trong Meta AI để xem liệu nó có tốt như Zuck nói hay không. Nói Short, Llama-3 đã giới thiệu một số tính năng và khả năng đáng chú ý và sẽ là một mô hình nền tảng tuyệt vời mà cộng đồng nguồn mở có thể lặp lại.

Kiểm duyệt nội dung

Llama-3 thể hiện cam kết mạnh mẽ về việc kiểm duyệt nội dung. Nó liên tục từ chối tạo ra nội dung có hại về chủng tộc, ngay cả khi phải đối mặt với các kỹ thuật bẻ khóa thông thường.

Ví dụ: khi người mẫu được yêu cầu hướng dẫn cách quyến rũ một phụ nữ, nó sẽ đưa ra những câu trả lời chung chung nhưng hữu ích. Tuy nhiên, khi được yêu cầu hướng dẫn cách dụ dỗ vợ bạn thân, người mẫu kiên quyết từ chối đưa ra câu trả lời.

Hình ảnh và hoạt hình

Tương tự như ChatGPT-Plus, Meta AI với Llama-3 có khả năng tạo hình ảnh. Tuy nhiên, khả năng này phải tiến thêm một bước nữa bằng cách cung cấp tùy chọn tạo hoạt ảnh cho chúng—một tính năng không có trong ChatGPT hoặc Gemini.

Hình ảnh do Meta AI tạo ra với Llama-3 thực tế hơn so với hình ảnh do Dalle-3 tạo ra, nhưng chúng Short chất lượng hình ảnh do ImageFX sắp ra mắt của Google tạo ra.

Khả năng mã hóa

Llama-3 đã được chứng minh là rất thành thạo về mã hóa. Khi trình bày một ý tưởng trò chơi độc đáo và được giải thích kém, mô hình này có thể tạo ra mã Python cần thiết trong hai lần thử, tạo ra một trò chơi hoạt động được. Cảnh quay đầu tiên đã cho chúng tôi ý tưởng sơ bộ về cách tạo trò chơi, nhưng nó đã tạo ra mã hoạt động được sau khi chúng tôi làm rõ rằng chúng tôi cần nó bằng Python.

Trò chơi vẫn hoạt động nhưng thiếu một số chi tiết nhỏ, chẳng hạn như khởi động lại sau khi người chơi thắng. Tuy nhiên, điều tương tự cũng xảy ra với các chatbot khác.

Chúng tôi nhận thấy Claude 3 Sonnet là công cụ tốt nhất cho nhiệm vụ này, tiếp theo là Llama 3. GPT-4 rơi xuống vị trí thứ ba. Tuy nhiên, những người dùng khác nhau có thể nhận được kết quả khác nhau.

Đây là một Pastebin chứa các mã nguồn được tạo bởi Llama3, Claude và ChatGPT dành cho những ai quan tâm đến việc thử nghiệm chúng.

Trung lập chính trị

Mô hình này hướng tới tính trung lập về chính trị, được chứng minh bằng phản ứng của nó đối với các câu hỏi về chủ nghĩa tư bản và chủ nghĩa cộng sản. Các câu trả lời có cấu trúc tương tự nhau, cung cấp phần giới thiệu, ưu và nhược điểm cho từng hệ thống.

Mô hình trung lập này cũng được quan sát thấy khi trả lời các câu hỏi như "Đàn ông là gì?" và "Phụ nữ là gì?"

Tuy nhiên, phản ứng của nó là hơi ủng hộ chủ nghĩa tư bản và nghiêng về cánh tả, điều này không có gì đáng ngạc nhiên vì đây là xu hướng chính trị phổ biến nhất trong các mô hình ngôn ngữ lớn.

Lý luận logic

Llama-3 đã thể hiện khả năng suy luận logic mạnh mẽ. Khi thử nghiệm với các câu hỏi LSAT phức tạp thường gây nhầm lẫn cho người dùng, mô hình không chỉ đưa ra câu trả lời đúng mà còn đưa ra lời giải thích rõ ràng và hợp lý.

Giới hạn nhắc nhở dài hạn

Mặc dù có nhiều điểm mạnh nhưng Llama-3 vẫn gặp khó khăn với những lời nhắc dài dòng. Khi được hiển thị với một lời nhắc dài khoảng một trang rưỡi ngữ cảnh — có thể được các mô hình như GPT-4, Claude hoặc Mistral nhập vào — mô hình trả về một thông báo lỗi.

Hiểu ngôn ngữ

Mô hình này thể hiện sự hiểu biết sâu sắc về các ngôn ngữ khác nhau. Khi được yêu cầu dịch một khẩu hiệu bằng tiếng Tây Ban Nha, nó không chỉ cung cấp bản dịch chính xác mà còn cung cấp ngữ cảnh để hiểu rõ hơn về khẩu hiệu đó.

Là một giao diện chatbot, Meta AI (được cung cấp bởi Llama3) có thể cạnh tranh với ChatGPT Plus và là một lựa chọn tuyệt vời về tổng thể.

Ở cấp độ kỹ thuật hơn, LLama3 với tư cách là LLM đủ tốt để cạnh tranh với GPT-4 trong các tình huống khác nhau, chỉ thua về khả năng bối cảnh Token và Thế hệ tăng cường truy xuất (về cơ bản là lấy thông tin từ một tập dữ liệu cụ thể do người dùng cung cấp). Điều này có thể quan trọng đối với người dùng am hiểu công nghệ, nhưng có thể không phải là vấn đề lớn đối với người thường.

Nếu bạn chủ yếu sử dụng ChatGPT để tạo hình ảnh bằng Dall-E, bạn có thể cân nhắc việc hủy đăng ký của mình vì khả năng tạo hình ảnh và hoạt ảnh của Llama-3 là tương đương nhau. Tuy nhiên, nếu bạn cũng cần hỗ trợ cho những lời nhắc dài, Llama-3 có thể không phải là lựa chọn tốt nhất cho bạn và bạn có thể cân nhắc gắn bó với ChatGPT-Plus.

Người dùng không thường xuyên có thể thấy rằng Llama-3 đáp ứng nhu cầu của họ mà không yêu cầu tư cách thành viên trả phí.

Đối với những công việc đòi hỏi phải nghiên cứu nhiều trên Internet, ChatGPT Plus hoặc Perplexity có thể phù hợp hơn.

Cuối cùng, nếu bạn tập trung vào mã hóa, Llama-3 có thể là một lựa chọn thay thế tốt, mặc dù có sẵn các công cụ chuyên dụng khác. Việc Llama-3 miễn phí là một lợi thế đáng kể.

Ryan Ozawa biên tập.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận