Lấy cảm hứng từ Steve Jobs, Giám đốc điều hành của OpenAI, Sam Altman đã tiết lộ kế hoạch vào thứ Tư để đơn giản hóa đáng kể danh mục sản phẩm của công ty, hợp nhất bộ sưu tập các mô hình trí tuệ nhân tạo rải rác của họ thành một hệ thống thống nhất duy nhất.
Động thái này đến chỉ vài tuần sau khi đối thủ Trung Quốc DeepSeek gây chấn động bằng cách ra mắt một trí tuệ nhân tạo đơn giản hơn và mạnh mẽ hơn, đe dọa sẽ lấn át các sản phẩm phức tạp hơn của OpenAI.
"Chúng tôi muốn làm tốt hơn trong việc chia sẻ lộ trình dự định của mình và làm tốt hơn nhiều trong việc đơn giản hóa các sản phẩm của chúng tôi," Sam Altman đã viết trong một tweet.
OpenAI hiện có một bộ sưu tập mô hình đa dạng (một số người có thể nói là gây nhầm lẫn), với GPT là LLM sáng tạo, "o" là mô hình lý luận, "Dall-e" là bộ tạo hình ảnh, "Sora" là bộ tạo video và "GPT-Vision" là mô hình để hiểu về thị giác.
Vang vọng khẩu hiệu nổi tiếng của Jobs, Altman đã tweet rằng "Chúng tôi muốn Trí tuệ nhân tạo 'chỉ hoạt động' cho bạn; chúng tôi nhận thấy các sản phẩm và mô hình của chúng tôi đã trở nên phức tạp như thế nào."
Nêu sơ lược lộ trình, Altman hứa sẽ làm mới giao diện gây nhầm lẫn buộc người dùng phải chọn giữa các phiên bản Trí tuệ nhân tạo khác nhau cho các nhiệm vụ khác nhau.
Giải pháp? Quay lại với những gì Altman gọi là "trí tuệ thống nhất như phép màu" trong đó công ty sẽ hợp nhất các mô hình văn bản khác nhau của mình, bao gồm cả "chuỗi o" bí ẩn và gia đình GPT, thành một hệ thống duy nhất có thể xử lý mọi thứ từ trò chuyện thoải mái đến phân tích phức tạp.
"Một mục tiêu hàng đầu của chúng tôi là thống nhất các mô hình chuỗi o và chuỗi GPT bằng cách tạo ra các hệ thống có thể sử dụng tất cả các công cụ của chúng tôi, biết khi nào nên suy nghĩ lâu hơn hoặc không, và nói chung hữu ích cho một loạt rất rộng các nhiệm vụ," Altman đã viết.
Bước đầu tiên trong hướng đó sẽ là việc ra mắt GPT-4.5, được gọi nội bộ là "Orion".
Dự kiến sẽ được ra mắt trong vài tuần và tháng tới như Altman xác nhận - đây sẽ là mô hình GPT cuối cùng được xây dựng dựa trên công nghệ GPT truyền thống, tức là ChatGPT mà tất cả chúng ta đều biết và yêu thích.
Sự thay đổi thực sự sẽ đến với GPT-5, được cho là sẽ kết hợp tất cả các công nghệ của OpenAI, bao gồm cả khả năng của mô hình o3 chưa được phát hành.
Nói cách khác, GPT-5 sẽ là một loại trung tâm Trí tuệ nhân tạo có thể thực hiện mọi thứ mà các mô hình khác của nó làm hiện nay, từ tạo hình ảnh đến viết sáng tạo đến lý luận và lập trình phức tạp, tùy thuộc vào nhiệm vụ. Người dùng sẽ không cần phải chọn mô hình nào tốt nhất cho nhiệm vụ.
Những "mô hình lý luận" được gọi là của OpenAI hoạt động thông qua một truy vấn thông qua "chuỗi suy nghĩ", một kỹ thuật mà một mô hình phân tích một câu hỏi và tạo ra một chuỗi các bước lý luận trung gian trước khi đi đến một kết luận.
Thông thường, các mô hình lý luận không tốt trong các nhiệm vụ sáng tạo, và ngược lại: các mô hình tốt về sáng tạo (như GPT-4.5) thường kém về lý luận, đặc biệt khi sử dụng lệnh zero-shot - người dùng mong đợi thực hiện mọi thứ trong một lệnh duy nhất.
Không nghi ngờ gì, bị khiêu khích bởi sự cạnh tranh mới với DeepSeek, mà việc ra mắt bất ngờ gần đây đã chứng minh mô hình Trí tuệ nhân tạo của nó vượt trội hơn, có sẵn miễn phí và mã nguồn mở, OpenAI đã công bố hôm nay rằng GPT-5 sẽ có sẵn thông qua tầng miễn phí của ChatGPT.
Người dùng sẽ có quyền truy cập không giới hạn vào cài đặt trí tuệ tiêu chuẩn, mặc dù việc sử dụng sẽ được theo dõi để ngăn chặn lạm dụng.
Đối với doanh nghiệp và nghiên cứu cấp chuyên nghiệp, công ty đã giới thiệu một hệ thống truy cập phân cấp sẽ cung cấp cho khách hàng trả tiền sức mạnh tính toán lớn hơn.
Ngoài ra, các thuê bao sẽ có quyền truy cập vào cài đặt trí tuệ cao hơn sử dụng nhiều năng lượng tính toán hơn để giải quyết các nhiệm vụ phức tạp, trong khi người dùng Pro sẽ nhận được phiên bản mạnh mẽ nhất.
"Các mô hình này sẽ kết hợp giọng nói, canvas, tìm kiếm, nghiên cứu sâu và nhiều hơn nữa," Altman đã viết.
Những thay đổi này cũng có nghĩa là OpenAI sẽ không phát hành các mô hình lý luận/lập trình như một lời chào hàng độc lập - thậm chí cả mô hình o3 hiện có - thay vào đó sẽ kết hợp khả năng của chúng vào hệ thống GPT-5 thống nhất.
Đối với các nhà phát triển sử dụng API của OpenAI, điều này có nghĩa là quá trình tích hợp đơn giản hơn - thay vì phải chọn giữa các mô hình khác nhau, họ sẽ truy cập vào một hệ thống duy nhất có thể xử lý các nhiệm vụ đa dạng.
Tuy nhiên, điều này cũng có thể phản tác dụng vì một số trường hợp sử dụng cụ thể có thể có lợi nhuận hơn với ít năng lượng tính toán hơn và giá Token rẻ hơn.
OpenAI không đi sâu vào việc sẽ ảnh hưởng như thế nào đến chi phí API. Nhưng Sam Altman chắc chắn rằng điều này sẽ đáng giá - thực tế, ông hy vọng nó sẽ mạnh mẽ đến mức ông đã nói quá lên, nói rằng "Tôi không nghĩ rằng tôi sẽ thông minh hơn GPT-5" trong một bảng thảo luận gần đây ở Berlin.
Như một người nổi tiếng đã nói, "Hãy luôn đói khát, hãy luôn ngốc nghếch", Sam.
Được chỉnh sửa bởi Josh Quittner và Sebastian Sinclair