Meta đang đào tạo người kế thừa mạnh mẽ hơn cho Llama 3

avatar
WIRED
04-19
Bài viết này được dịch máy
Xem bản gốc

Vào sáng thứ Năm, Meta đã phát hành mô hình trí tuệ nhân tạo mới nhất của mình, Llama 3, chào hàng đây là mô hình mã nguồn mở mạnh mẽ nhất để bất kỳ ai cũng có thể sử dụng nó. Chiều cùng ngày, Yann LeCun, nhà khoa học AI trưởng của Meta , cho biết một phiên bản kế nhiệm thậm chí còn mạnh mẽ hơn Llama đang được phát triển. Ông cho rằng nó có khả năng vượt trội hơn các mô hình AI khép kín tốt nhất thế giới, bao gồm GPT-4 của OpenAIGemini của Google .

Hôm nay Meta đã phát hành hai phiên bản của Llama 3, một phiên bản có 8 tỷ thông số—một thuật ngữ trong ngành mô tả đại khái sức mạnh của mô hình—và một phiên bản khác có 70 tỷ thông số. LeCun cho biết các mô hình lớn hơn đang được phát triển và mô hình mạnh nhất, với hơn 400 tỷ thông số, hiện đang được đào tạo.

LeCun cho biết tại Imagination in Action , một hội nghị tại MIT tập trung vào AI sáng tạo: “Phải mất rất nhiều thời gian để tinh chỉnh, nhưng một loạt biến thể của những mô hình này sẽ xuất hiện trong vài tháng tới”. Hiện chưa rõ khi nào model với hơn 400 tỷ thông số có thể ra mắt.

Meta hôm thứ Ba đã ra mắt một trợ lý mới có tên Meta AI dựa trên Llama 3 và cho biết thử nghiệm của nó cho thấy các mô hình này tốt hơn các mô hình nguồn mở trước đây với số lượng tham số tương tự. Mặc dù hầu hết các nhà phát triển AI lớn nhất như Google và OpenAI vẫn giữ nguyên công nghệ của họ nhưng LeCun dự đoán rằng các mô hình AI nguồn mở sẽ phát triển nhanh hơn. Về lý thuyết, ông nói, họ sẽ đẩy AI tiến tới trí thông minh ngang tầm con người nhanh hơn.

LeCun lập luận rằng nhìn vào ngành công nghiệp phần mềm rộng hơn cho thấy công nghệ nguồn mở cuối cùng sẽ giành chiến thắng. Ông nói, cách tiếp cận mở đã trở nên chiếm ưu thế trong cơ sở hạ tầng phần mềm bởi vì nó cho phép các cải tiến được chia sẻ nhanh hơn và mã được xem xét kỹ lưỡng hơn một cách toàn diện hơn. Ông nói: “AI sẽ tốt hơn khi có nhiều người xem mã hơn. “Cơ sở hạ tầng cần phải là nguồn mở—nó sẽ phát triển nhanh hơn.”

Chiến lược AI nguồn mở của Meta đã giúp đẩy nhanh cơn sốt hiện nay xung quanh AI sáng tạo. Khi công ty phát hành mô hình Llama 2 vào tháng 7 năm 2023, nó đã cung cấp cho nhiều công ty khởi nghiệp, nhà nghiên cứu và doanh nhân quyền truy cập vào các mô hình AI mạnh mẽ hơn nhiều để tải xuống để thử nghiệm và phát triển.

GPT-4 của OpenAI và Gemini của Google chỉ khả dụng thông qua các API trả phí, mặc dù Google đã cung cấp một mô hình nhỏ hơn có tên Gemma để tải xuống vào tháng 2. Một số công ty khác đã chọn tham gia cùng Meta để phát hành các mô hình AI nguồn mở mạnh mẽ. Chỉ vài tuần trước, một mô hình mới của công ty khởi nghiệp Databricks là biến thể mở mạnh mẽ nhất hiện có. Llama 3 dường như có khả năng cao hơn nếu điểm chuẩn được Meta báo cáo là chính xác.

LeCun cũng thừa nhận hôm thứ Ba rằng chiến lược của Meta liên quan đến việc tặng các mô hình AI khiến Meta phải trả giá đắt về tài nguyên nghiên cứu và máy tính để phát triển. Mark Zuckerberg , người sáng lập và Giám đốc điều hành của Meta, nói với CNBC vào tháng 1 rằng Meta sẽ chi hàng tỷ đô la vào năm 2024 để mua GPU cần thiết để đào tạo các thuật toán học máy. Cùng tháng đó, anh ấy tuyên bố rằng mục tiêu cuối cùng của Meta — giống như mục tiêu mà OpenAI và Google đã tuyên bố — là phát triển cái gọi là trí tuệ nhân tạo tổng hợp , những cỗ máy có thể làm bất cứ điều gì và mọi thứ mà trí tuệ con người có thể làm được.

Zuckerberg đã lên Instagram hôm nay để giải thích rằng Meta sẽ kết hợp trợ lý Meta AI mới, được cung cấp bởi Llama 3, vào các sản phẩm bao gồm Whatsapp, Instagram, Facebook và Messenger.

Meta cho biết trong bài đăng trên blog thông báo về Llama 3 rằng họ đã tập trung rất nhiều vào việc cải thiện dữ liệu đào tạo được sử dụng để phát triển mô hình. Công ty cho biết, nó được cung cấp lượng dữ liệu nhiều gấp bảy lần so với phiên bản tiền nhiệm của nó, Llama 2. Một số chuyên gia AI lưu ý rằng số liệu do Meta đưa ra cũng cho thấy việc tạo ra Llama 3 cần lượng năng lượng khổng lồ để cung cấp năng lượng cho các máy chủ cần thiết.

Khả năng ngày càng tăng của các mô hình AI nguồn mở đã khiến một số chuyên gia lo lắng rằng chúng có thể giúp phát triển vũ khí mạng, hóa học hoặc sinh học dễ dàng hơn - hoặc thậm chí trở nên thù địch với con người. Meta đã phát hành các công cụ mà họ cho rằng có thể giúp đảm bảo Llama không đưa ra những lời nói có khả năng gây hại.

Những người khác trong lĩnh vực AI nói rằng các mô hình Llama của Meta không cởi mở như mong đợi . Giấy phép nguồn mở của công ty trên các mô hình đặt ra một số hạn chế đối với những gì các nhà nghiên cứu và nhà phát triển có thể xây dựng.

Luca Soldaini, nhà khoa học nghiên cứu ứng dụng cấp cao tại Viện AI của Allen, một phòng thí nghiệm phi lợi nhuận, cho biết: “Thật tuyệt khi thấy ngày càng có nhiều người mẫu công khai thả tạ của mình”. “Nhưng cộng đồng mở cần quyền truy cập vào tất cả các phần khác của quy trình AI—dữ liệu, đào tạo, nhật ký, mã và đánh giá của nó. Đây chính là điều cuối cùng sẽ đẩy nhanh sự hiểu biết chung của chúng ta về những mô hình này.”

Stella Biderman , một nhà nghiên cứu AI có liên quan đến EleutherAI , một dự án AI nguồn mở phi lợi nhuận, cho biết giấy phép của Meta dành cho Llama 2 đã hạn chế các thử nghiệm mà các nhà nghiên cứu AI có thể chạy với nó và nói thêm rằng giấy phép Llama 3 thậm chí còn hạn chế hơn. Biderman nói: “Meta giải phóng sức nặng nhưng lại rất hạn chế về những gì bạn có thể làm với chúng.

Một phần trong giấy phép của mô hình nói rằng các công ty có “hơn 700 triệu người dùng hoạt động hàng tháng” phải xin giấy phép đặc biệt từ Meta—một điều khoản dường như được thiết kế để ngăn chặn dự án giúp đỡ các đối thủ cạnh tranh gần nhất của công ty.

Mặc dù vậy, Llama 3 dường như sẽ khơi dậy một đợt thử nghiệm AI mới. Clement Delange, Giám đốc điều hành của HuggingFace , một kho lưu trữ các mô hình AI mở, bao gồm cả Llama 3, cho biết các nhà phát triển đã tạo ra hơn 30.000 biến thể của Llama 2. “Tôi chắc chắn rằng chúng ta cũng sẽ thấy một loạt các mô hình mới dựa trên Llama 3, " anh ta nói. “Động thái cộng đồng tuyệt vời của Meta.”

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
9
Thêm vào Yêu thích
1
Bình luận