OpenAI hôm nay đã công bố một phiên bản cải tiến của mô hình trí tuệ nhân tạo mạnh mẽ nhất của họ cho đến nay - một mô hình mà cần nhiều thời gian hơn để suy ngẫm về các câu hỏi - chỉ một ngày sau khi Google công bố mô hình đầu tiên của loại này.
Mô hình mới của OpenAI, được gọi là o3, thay thế o1, mà công ty đã giới thiệu vào tháng 9. Giống như o1, mô hình mới dành thời gian suy ngẫm về một vấn đề để đưa ra câu trả lời tốt hơn cho các câu hỏi yêu cầu lập luận logic từng bước. (OpenAI đã chọn bỏ qua cái tên "o2" vì nó đã là tên của một nhà mạng di động ở Vương quốc Anh.)
"Chúng tôi xem đây là sự khởi đầu của giai đoạn tiếp theo của trí tuệ nhân tạo," Sam Altman, Giám đốc điều hành của OpenAI, nói trong một buổi phát trực tiếp vào thứ Sáu. "Nơi bạn có thể sử dụng những mô hình này để thực hiện các nhiệm vụ ngày càng phức tạp hơn yêu cầu nhiều suy luận."
Mô hình o3 đạt điểm số cao hơn nhiều so với tiền nhiệm của nó trên nhiều chỉ số, bao gồm cả những chỉ số đo lường các kỹ năng lập trình phức tạp và năng lực toán học và khoa học nâng cao. Nó tốt hơn o1 gấp 3 lần trong việc trả lời các câu hỏi được đặt ra bởi ARC-AGI, một tiêu chuẩn được thiết kế để kiểm tra khả năng suy luận của một mô hình trí tuệ nhân tạo đối với các vấn đề toán học và logic cực kỳ khó mà chúng chưa từng gặp phải.
Google cũng đang theo đuổi một hướng nghiên cứu tương tự. Noam Shazeer, một nhà nghiên cứu của Google, hôm qua đã tiết lộ trong một bài đăng trên X rằng công ty đã phát triển mô hình suy luận riêng của mình, có tên là Gemini 2.0 Flash Thinking. Giám đốc điều hành Google, Sundar Pichai, đã gọi nó là "mô hình suy ngẫm kỹ lưỡng nhất của chúng tôi" trong bài đăng của riêng ông.
Hai mô hình đối đầu này cho thấy cuộc cạnh tranh giữa OpenAI và Google ngày càng gay gắt hơn. Điều quan trọng là OpenAI phải chứng minh rằng họ có thể tiếp tục đạt được những tiến bộ khi họ tìm cách thu hút thêm đầu tư và xây dựng một doanh nghiệp có lợi nhuận. Trong khi đó, Google đang tuyệt vọng để chứng minh rằng họ vẫn dẫn đầu trong lĩnh vực nghiên cứu trí tuệ nhân tạo.
Các mô hình mới này cũng cho thấy các công ty trí tuệ nhân tạo đang ngày càng tìm cách vượt ra ngoài việc chỉ đơn giản là mở rộng quy mô các mô hình trí tuệ nhân tạo để khai thác được nhiều trí thông minh hơn từ chúng.
OpenAI cho biết có hai phiên bản của mô hình mới, o3 và o3-mini. Công ty chưa công bố công khai các mô hình này nhưng cho biết sẽ mời những người bên ngoài nộp đơn để thực hiện việc kiểm tra chúng. Hôm nay, OpenAI cũng tiết lộ thêm về các kỹ thuật được sử dụng để làm cho o1 được định hướng. Điều này bao gồm việc cho mô hình suy ngẫm về bản chất của yêu cầu được đưa ra để xem xét liệu nó có thể vi phạm các rào cản của nó hay không.
Các mô hình ngôn ngữ lớn có thể trả lời nhiều câu hỏi một cách đáng kinh ngạc, nhưng chúng thường vấp phải khi được yêu cầu giải quyết các câu đố yêu cầu toán học hoặc logic cơ bản. Mô hình o1 của OpenAI kết hợp việc đào tạo về giải quyết vấn đề từng bước, giúp một mô hình trí tuệ nhân tạo có khả năng tốt hơn trong việc giải quyết những loại vấn đề này.
Các mô hình suy luận về các vấn đề cũng sẽ rất quan trọng khi các công ty tìm cách triển khai những gì được gọi là các tác nhân trí tuệ nhân tạo có thể đáng tin cậy để giải quyết các vấn đề phức tạp thay mặt người dùng. Mô hình o3 tốt hơn o1 20% trong SWE-Bench, một bài kiểm tra đo lường khả năng tác nhân của một mô hình.
"Điều này thực sự cho thấy chúng ta đang thực sự leo lên đỉnh của tiện ích," Mark Chen, Phó chủ tịch cấp cao về nghiên cứu tại OpenAI, nói trong buổi phát trực tiếp hôm nay.
"Mô hình này thật tuyệt vời trong lập trình," Atlman thêm vào.
Trong khi vẫn chưa có một khoảnh khắc đột phá thực sự, nhịp độ các thông báo về trí tuệ nhân tạo đã trở nên chóng mặt gần đây.
Đầu tháng này, Google đã công bố một phiên bản mới của mô hình cờ đầu của họ, có tên là Gemini 2.0, và đã trình diễn nó như một trợ lý duyệt web và một trợ lý có thể nhìn thấy thế giới thông qua một chiếc điện thoại thông minh hoặc một cặp kính thông minh.
OpenAI đã đưa ra nhiều thông báo trong thời gian chuẩn bị cho Giáng sinh, bao gồm một phiên bản mới của mô hình tạo video của họ, một phiên bản miễn phí của công cụ tìm kiếm được cung cấp bởi ChatGPT, và một cách để truy cập ChatGPT qua điện thoại bằng cách gọi 1-800-ChatGPT.
Cập nhật 20/12/24 13:16 ET: Câu chuyện này đã được cập nhật với thêm bình luận và chi tiết từ OpenAI.