OpenAI ra mắt mô hình o3! Khả năng suy luận được cải thiện hơn nữa, mở đường cho thế hệ AI tiếp theo.

avatar
BlockTempo
19 giờ trước
Bài viết này được dịch máy
Xem bản gốc

ChatGPT, do OpenAI phát triển, đã ra mắt 12 sản phẩm mới liên tiếp vào ngày hôm qua (20), và sản phẩm cuối cùng là mô hình suy luận mới "o3" và "o3-mini". Mô hình AI này có khả năng suy luận mạnh hơn, nhằm giải quyết các nhiệm vụ phức tạp yêu cầu suy luận logic từng bước.

Đặc điểm mô hình

1) Khả năng suy luận đạt kết quả SoTA

OpenAI tuyên bố rằng mô hình o3 đã thể hiện xuất sắc trong nhiều bài kiểm tra chuẩn, bao gồm các vấn đề lập trình, toán học và khoa học phức tạp, cho thấy khả năng suy luận logic mạnh mẽ của nó.

Trong đánh giá "ARC-AGI" do Alignment Research Center (ARC) phát triển để kiểm tra khả năng Trí tuệ nhân tạo tổng quát (AGI) của các hệ thống AI, o3 đã đạt được kết quả đột phá 75,7% trong một số bài kiểm tra không công khai, lập kỷ lục mới (State of the Art, SoTA).

Hơn nữa, một phiên bản o3 có tài nguyên tính toán cao hơn đã đạt được kết quả 87,5% trong cùng bài kiểm tra, nhưng có thể do yêu cầu tài nguyên vượt quá tiêu chuẩn nên không đủ điều kiện để được công bố trong ARC-AGI-Pub (kết quả ARC-AGI có thể xác minh công khai).

2) Nhiều lựa chọn phiên bản

OpenAI cung cấp hai phiên bản là o3 và o3-mini, với o3-mini dự kiến ra mắt vào cuối tháng 1 năm 2025, còn phiên bản đầy đủ của o3 sẽ được phát hành sau đó (chưa công bố thời gian cụ thể).

Mô hình mới này sử dụng API Thời gian Suy nghĩ Thích ứng (Adaptive Thinking Time) mới được OpenAI giới thiệu gần đây, cung cấp ba chế độ suy luận khác nhau là thấp, trung bình và cao. Tính năng này cho phép người dùng điều chỉnh thời gian "suy nghĩ" của mô hình trước khi trả lời. Như hình dưới đây cho thấy, o3-mini có thể đạt kết quả tương đương với mô hình o1 hiện tại, nhưng với chi phí tính toán đáng kể thấp hơn.

3) Tăng cường bảo mật

OpenAI đã áp dụng phương pháp đào tạo mới "Deliberative alignment" (Sự căn chỉnh cẩn trọng), trực tiếp dạy các mô hình ngôn ngữ lớn (LLMs) hiểu các quy tắc an toàn được viết bởi con người, và đảm bảo tuân thủ các quy tắc này trong quá trình suy luận trước khi trả lời. OpenAI cho biết:

Thông qua phương pháp này, chúng tôi đã thành công trong việc tối ưu hóa các mô hình o của OpenAI để sử dụng kỹ thuật "Chuỗi Suy luận" (Chain-of-Thought, CoT), suy ngẫm về câu hỏi của người dùng, tìm ra các văn bản quy định liên quan trong chính sách nội bộ của OpenAI, từ đó tạo ra các phản hồi an toàn hơn.

Nguồn gốc tên gọi

Đáng chú ý là OpenAI đã bỏ qua tên "o2" và trực tiếp sử dụng "o3". Giám đốc điều hành Sam Altman giải thích rằng điều này nhằm tránh nhầm lẫn với nhà cung cấp viễn thông O2 ở Anh, đồng thời thể hiện sự hài hước độc đáo của OpenAI. Ông nói trong buổi phát sóng trực tiếp:

"Vì tôn trọng Telefónica (công ty mẹ của O2), và tiếp tục truyền thống tuyệt vời của OpenAI trong việc đặt tên, chúng tôi đã đặt tên nó là o3."

Mời các nhà nghiên cứu tham gia kiểm tra an toàn

Hiện tại, o3 và o3-mini đang trong giai đoạn kiểm tra an toàn nội bộ, OpenAI đã mở đăng ký để mời các nhà nghiên cứu bên ngoài tham gia kiểm tra an toàn. Thời hạn đăng ký sẽ kết thúc vào ngày 10 tháng 1 năm 2025.

Về việc ra mắt mô hình này, Sam Altman tự tin tuyên bố rằng đây là dấu mốc AI chính thức bước vào "giai đoạn tiếp theo".

Nhìn lại bảng phân loại AI của OpenAI được Bloomberg tiết lộ vào giữa năm nay, sau các trợ lý trò chuyện và mô hình suy luận, giai đoạn tiếp theo là Agents - các hệ thống AI tiên tiến có thể thực hiện hành động thay mặt người dùng. Đây chính là hướng đang được thị trường tiền điện tử và Web2 tích cực nghiên cứu và phát triển.

Hệ thống phân loại AI của OpenAI. Nguồn: Bloomberg

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
1
Thêm vào Yêu thích
Bình luận