GPT-5 sẽ được phát hành trong hai tuần tới?
Chỉ ngày hôm nay, đã có tiết lộ mới về GPT-5.
Yuchen Jin, đồng sáng lập Hyperbolic, tuyên bố rằng ông đã nghe được một số thông tin nội bộ.
GPT-5 không phải là một mô hình duy nhất mà là một hệ thống gồm nhiều mô hình.
Nó bao gồm một "bộ định tuyến" có thể chuyển đổi giữa các mô hình suy luận, mô hình phi suy luận và mô hình sử dụng công cụ. Đây là lý do tại sao Altman cho biết OpenAI sẽ sửa lỗi đặt tên mô hình: trong tương lai, các từ gợi ý sẽ được tự động định tuyến đến mô hình phù hợp nhất.
GPT-6, đang trong quá trình đào tạo.
Một người hiểu biết khác cũng xác nhận điều này.
Trên thực tế, việc GPT-5 sắp ra mắt không phải là tin mới.
Khi nhà nghiên cứu Alexander Wei của OpenAI công bố vào thứ Bảy rằng mô hình mới đã giành được huy chương vàng IMO, ông đã thông báo rằng GPT-5 sẽ sớm được phát hành, nhưng đó sẽ không phải là mô hình giành được huy chương vàng IMO.
Và chỉ ngày hôm qua, cụm từ GPT-5-reasoning-alpha-2025-07-13 cũng xuất hiện trong mã mã nguồn mở của một tổ chức bên thứ ba.
Mô hình GPT-5 bị rò rỉ trong quá trình đánh giá chuẩn sinh học
Và sáng nay, Ultraman một lần nữa đăng rằng vào cuối năm nay, OpenAI sẽ bổ sung hơn 1 triệu GPU, rõ ràng là để dành nhiều tỷ lệ băm hơn cho mô hình mới.
Liệu GPT-5 có làm bùng nổ thị trường hay sẽ không tạo ra bước đột phá nào?
Điều chắc chắn là GPT-5 sẽ ra đời chậm nhất là vào tháng 9.
Vài ngày trước, mô hình bí ẩn o3-Alpha ra mắt và bị OpenAI xóa khỏi chuẩn mực công khai chỉ sau 12 giờ.
Điều này có thể cho thấy phiên bản chính thức sắp được phát hành.
Dữ liệu lịch sử cho thấy khi OpenAI thử nghiệm các mô hình bí mật như "Optimus Alpha" và "Quasar Alpha", Quasar đã phát hành phiên bản chính thức sau 11 ngày và Optimus Alpha chỉ được công bố chính thức sau đó 4 ngày.
Một số người lạc quan về GPT-5 sắp ra mắt, trong khi những người khác lại bi quan.
OpenAI thay thế mô hình O3 bằng GPT‑5 Reasoning‑Alpha
Ví dụ, giáo sư Ethan Mollick của trường Wharton cho biết ngay cả khi GPT-5 chỉ có thể tự động chuyển đổi giữa o3 và 4o, nó cũng sẽ thay đổi quan điểm của hầu hết mọi người về AI.
Nhưng nhiều người cũng đánh giá dựa trên nhiều chi tiết khác nhau: GPT-5 có khả năng là một bộ định tuyến.
Ví dụ, CPO Kevin Weil của OpenAI đã tiết lộ một số manh mối về GPT-5 vào tháng 2 năm nay.
Nếu GPT-5 thực sự chỉ là một bộ định tuyến thì công chúng rõ ràng sẽ thất vọng: nó rõ ràng sẽ không có nhiều cải tiến về trí thông minh cơ bản và chúng ta chỉ có thể chờ Gemini 3 hoặc Claude Sonnet 5.
Nhiều người cho rằng ngay cả khi OpenAI thực sự phát hành GPT-5, khả năng của mô hình sẽ không được cải thiện đáng kể trừ khi có những công cụ tốt hơn hoặc một số phương pháp khéo léo để sử dụng RL nhằm cải thiện hiệu suất.
Tóm lại, nhiều người đang mong đợi GPT-5 có thể sẽ thất vọng!
Nhưng một số người cho rằng bộ định tuyến đại diện cho độ tin cậy và chuyên môn hóa. Erika hiệu quả vì nó phân bổ các loại chi phí khác nhau cho các đường dẫn logic tương ứng.
Trí thông minh chung cơ bản có thể trông ấn tượng khi chạy chuẩn mực, nhưng thứ thực sự có thể ra mắt và mở rộng là hệ thống định tuyến chuyên biệt.
Tóm lại, đừng đánh giá thấp loại đổi mới này. Đôi khi, một thiết kế kiến trúc có vẻ bình thường lại có thể vượt trội hơn một mô hình đột phá.
Ultraman phá vỡ sự im lặng, GPT-6 bước vào trận đấu cuối cùng
Tuy nhiên, thế hệ tiếp theo, GPT-6, có thể sẽ là hồi kết.
Cách đây một thời gian, Altman một lần nữa chia sẻ những hiểu biết của mình về sự phát triển trong tương lai của AI trong cuộc phỏng vấn dài 20 phút với Sarah Guo, người sáng lập Conviction.
Altman cho biết, chương trình mã hóa thông minh Codex do OpenAI phát hành đã khiến ông cảm nhận sâu sắc hơi thở của AGI.
Codex không chỉ có thể xử lý nhiệm vụ phức tạp một cách tự động mà còn có thể kết nối với GitHub và đọc các tài liệu nội bộ, chứng minh khả năng đáng kinh ngạc.
Ông thậm chí còn dự đoán rằng các tác nhân AI có thể giống như những thực tập sinh chỉ làm việc vài giờ ngày hôm nay, nhưng trong tương lai họ sẽ phát triển thành những kỹ sư cao cấp chỉ làm việc vài ngày.
Và cuối cùng nó sẽ trở thành một “nhà khoa học AI” có khả năng khám phá kiến thức mới — đây sẽ là một thời điểm quan trọng đối với toàn thế giới.
Người dẫn chương trình cũng hỏi, trong thế hệ mô hình tiếp theo, bạn đã quan sát thấy những "hành vi mới nổi" nào sẽ thay đổi cách thức hoạt động, ý tưởng xây dựng sản phẩm và mô hình hoạt động của OpenAI?
Về vấn đề này, Altman bày tỏ sự tin tưởng lớn rằng các mô hình trong 1-2 năm tới sẽ rất tuyệt vời, giống như bước nhảy vọt lớn từ GPT-3 lên GPT-4.
Điều các công ty có thể làm là chuyển giao những vấn đề khó khăn nhất trực tiếp cho thế hệ mô hình tiếp theo.
Ví dụ, một công ty thiết kế chip có thể yêu cầu LLM thiết kế một con chip tốt hơn. Một công ty công nghệ sinh học muốn chữa bệnh cũng có thể yêu cầu AI thiết kế một con chip tốt hơn.
Ultraman nói rằng tương lai như vậy đang ở rất gần.
Như đã đề cập trước đó, LLM có khả năng hiểu mọi bối cảnh, kết nối với mọi công cụ, mọi hệ thống, sau đó đưa ra lý luận cực kỳ xuất sắc và cường độ cao, đồng thời phản hồi các câu trả lời chất lượng cao.
Quan trọng nhất là chúng đủ mạnh mẽ và tự chủ để bạn có thể tin tưởng giao phó công việc cho chúng.
Ultraman lại phấn khích nói, tôi không nghĩ ngày này lại đến sớm như vậy, nhưng bây giờ, nó thực sự cảm thấy rất gần rồi.
Ông cũng đề xuất một lý tưởng Platon, một mô hình rất nhỏ với khả năng suy luận siêu phàm, chạy với tốc độ cực nhanh, có ngữ cảnh là một nghìn tỷ mã thông báo và có quyền truy cập vào tất cả các công cụ.
Theo cách này, vấn đề là gì hay mô hình có được tải sẵn kiến thức hay cơ sở dữ liệu hay không đều không còn quan trọng nữa.
Người ta có thể coi nó như một "công cụ suy luận" nơi bạn chỉ cần đưa vào đó tất cả các bối cảnh có thể có của một doanh nghiệp, cuộc sống của một người và các công cụ liên quan.
Altman cho biết: "Những gì mọi người đang làm với nó thật đáng kinh ngạc và tôi cho rằng chúng ta đang tiến theo hướng đó".
Khi được hỏi ông sẽ làm gì nếu có gấp nghìn lần nguồn lực tính toán, Altman cho biết ông sẽ để AI nghiên cứu cách xây dựng các mô hình tốt hơn và sau đó hỏi các mô hình mạnh hơn sử dụng nguồn lực đó như thế nào.
Đồng thời, việc tăng tài nguyên tính toán trong quá trình thử nghiệm có thể cải thiện đáng kể hiệu suất của mô hình, đặc biệt là khi giải quyết các vấn đề có giá trị cao.
Mười người của OpenAI đã từ chối lời đề nghị trị giá 300 triệu nhân dân tệ
Cùng lúc đó, hãng thông tấn nước ngoài WSJ cũng đăng tải một bài báo tiết lộ nhiều thông tin nội bộ.
Ví dụ, trong OpenAI, ít nhất mười nhân viên đã từ chối lời đề nghị 300 triệu đô la của Zuckerberg.
Trong số những người từ chối có Giám đốc nghiên cứu quen thuộc của OpenAI là Mark Chen và cha đẻ của Texas Poker là Noam Brown.
Người ta tiết lộ rằng vào mùa xuân này, Zuckerberg đã có một cuộc họp ngắn với Mark Chen và xin lời khuyên về cách cải thiện đội ngũ Meta-generative AI.
Không ngờ, lời nói của Mark Chen - tăng cường đầu tư vào nhân tài - đã khiến Zuckerberg bắt đầu điên cuồng săn đón nhân tài.
Trong số 44 thành viên của đội ngũ"Phòng thí nghiệm Siêu Trí tuệ" mới nhất, 40% đến từ OpenAI. Tuy nhiên, cũng có rất nhiều nhân tài từ chối mức lương cao ngất ngưởng của Zuckerberg.
Liệu anh ấy thực sự theo đuổi giấc mơ về AGI, hay anh ấy đã nhận ra rằng những gì Ultraman đã cho đi thực sự là đủ?
Tham khảo:
https://x.com/Yuchenj_UW/status/1946777842131632427
https://x.com/bindureddy/status/1946791998914179542
https://x.com/slow_developer/status/1946545812332540130
Bài viết này trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Xinzhiyuan, biên tập: Aeneas Taozi và được 36Kr cấp phép xuất bản.





