Hướng đi tiếp theo của sự phát triển mô hình quy mô lớn toàn cầu: GPT-5 của OpenAI đã có mặt

avatar
36kr
08-08
Bài viết này được dịch máy
Xem bản gốc

(Giám đốc điều hành OpenAI Sam Altman đang phát hành GPT-5 Nguồn ảnh/Trực tiếp từ trang web chính thức của OpenAI)

Mỗi thế hệ mô hình chủ lực của OpenAI, một công ty khởi nghiệp AI (trí tuệ nhân tạo) nổi tiếng của Mỹ, đều sẽ dẫn dắt xu hướng công nghệ toàn cầu trong nửa năm tới. Vào ngày 7 tháng 8 theo giờ miền Tây Hoa Kỳ, công ty này đã phát hành GPT-5.

Giám đốc điều hành OpenAI Sam Altman mô tả, GPT-3 cảm giác như đang trò chuyện với một học sinh trung học. Mặc dù đôi khi có những tia sáng, nhưng cũng có nhiều điều khó chịu. GPT-4o có lẽ giống như đang trò chuyện với một sinh viên đại học, nó có trí thông minh và tính ứng dụng thực sự. Và bây giờ, với GPT-5, giống như đang đối thoại với một chuyên gia - một chuyên gia tiến sĩ chuyên nghiệp luôn sẵn sàng trong bất kỳ lĩnh vực nào, họ có thể giúp bạn đạt được bất kỳ mục tiêu nào. GPT-5 không chỉ có thể trò chuyện mà còn có thể làm việc cho bạn.

GPT-5 là một hệ thống bao gồm hai mô hình (phiên bản suy nghĩ sâu + phiên bản hiệu quả cao, phiên bản trước có thể suy nghĩ sâu, phiên bản sau có thể trả lời hiệu quả). Nó sẽ tự động chuyển đổi phiên bản khi người dùng đặt câu hỏi.

Kết quả kiểm tra hiệu năng được OpenAI tiết lộ cho thấy, GPT-5 vượt qua mô hình chủ lực thế hệ trước là OpenAI o3, GPT-5 (phiên bản suy nghĩ sâu) có số lượng ảo giác ít hơn sáu lần so với o3. Tổ chức nghiên cứu thị trường quốc tế Artificial Analysis đã tiến hành kiểm tra hiệu năng dài hạn cho các mô hình chính toàn cầu, kết quả kiểm tra tính đến ngày 8 tháng 8 cho thấy, GPT-5 hiện là mô hình có hiệu năng mạnh nhất toàn cầu.

Đồng thời với việc nâng cao hiệu năng, chi phí tỷ lệ băm suy luận của GPT-5 cũng giảm đáng kể. Kết quả thử nghiệm được OpenAI công bố cho thấy, GPT-5 có hiệu suất chi phí tốt hơn OpenAI o3, số lượng token (đơn vị đo lường sức mạnh suy luận AI, một token có thể là từ, dấu chấm, số, ký hiệu, v.v.) giảm 50%-80%.

Thứ hai, các mô hình tạo video sẽ trở nên trưởng thành và khả dụng, dự kiến sẽ có một đợt bùng nổ vào cuối năm nay. Điều này có nghĩa là Agent không chỉ có thể hiểu thế giới, mà còn có thể tạo nội dung và mô phỏng quá trình theo cách năng động và trực quan hơn.

Thứ ba, khả năng xử lý các nhiệm vụ phức tạp nhiều bước sẽ được cải thiện đáng kể, dự kiến sẽ có một bước đột phá quan trọng vào cuối năm nay. Đây là bước quan trọng để Agent phát triển trưởng thành. Khi mô hình có thể lập kế hoạch và thực hiện các nhiệm vụ phức tạp chứa hàng chục thậm chí hàng trăm bước một cách ổn định và đáng tin cậy, vấn đề "bỏ dở" của Agent sẽ được giải quyết từ gốc rễ.

Theo quan điểm của Ngô Đức, hầu hết các ứng dụng Muti-Agent hiện tại đều "như đồ chơi", nhưng dựa trên những đột phá về ba dòng công nghệ này, ông đưa ra nhận định cuối cùng - độ chính xác của các ứng dụng Muti-Agent sẽ tăng đáng kể vào cuối năm 2025. Sau khi các ứng dụng AI có khả năng hiểu và suy luận hình ảnh trở nên phổ biến vào cuối năm 2025, lượng token tiêu thụ cho một nhiệm vụ cơ bản có thể sẽ vượt quá 10 nghìn token. Khi đó, lượng token tiêu thụ sẽ tăng nhanh chóng.

Một vòng đua mô hình mới được mở màn

Cơ sở của "bánh xe" mô hình, ứng dụng, tỷ lệ băm là năng lực mô hình không ngừng được nâng cao. Năm 2025, cuộc đua các mô hình lớn của các công ty công nghệ toàn cầu ngày càng gay gắt, tốc độ lặp lại các mô hình lớn đang được tăng tốc.

Sự thay đổi kiến thức trong lĩnh vực các mô hình lớn được tính bằng "tháng" thậm chí "tuần". Một bài báo, một mô hình có thể đảo lộn hoàn toàn đường lối công nghệ hiện tại. Một kỹ sư thuật toán kỳ cựu từng nói với《Tài Chính》rằng, trong lĩnh vực các mô hình lớn, mỗi tuần đều có rất nhiều bài báo học thuật được xuất bản; hầu như mỗi tháng đều có những đột phá công nghệ mới; hầu như cứ ba đến bốn tháng, các mô hình hàng đầu lại bị vượt qua.

Theo thống kê chưa đầy đủ của《Tài Chính》, trong 220 ngày từ ngày 1/1/2025 đến 8/8/2025, 11 công ty công nghệ Trung Quốc và Mỹ tham gia cuộc đua mô hình (bao gồm Alibaba, Bytedance, Tencent, Baidu, Huawei, DeepSeek, Nguyệt Chi Ám Diện, Google, OpenAI, Anthropic, xAI) đã phát hành hoặc lặp lại ít nhất 32 phiên bản mô hình lớn, trung bình cứ 6,9 ngày lại có một phiên bản mô hình lớn mới được phát hành.

Chu kỳ cập nhật các mô hình cơ bản thậm chí ngày càng ngắn hơn. Chu kỳ cập nhật từ GPT-4.5 đến GPT-5 của OpenAI là 161 ngày; từ o1 đến o3 của OpenAI là 132 ngày; từ Grok 3 đến Grok 4 của xAI là 142 ngày; hai phiên bản của DeepSeek-R1 là 128 ngày; hai phiên bản của DeepSeek-V3 là 87 ngày; hai phiên bản của Gemini 2.5 của Google chỉ là 42 ngày.

Việc phát hành GPT-5 sẽ buộc các công ty công nghệ Trung Quốc và Mỹ bước vào một vòng đua mô hình lớn mới - đào tạo các mô hình mạnh hơn, mua sắm các tỷ lệ băm quy mô lớn hơn, con đường này trong thời gian ngắn sẽ không thay đổi.

Sự phát triển của các mô hình lớn hiện tại có một số trụ cột then chốt. Thứ nhất là dữ liệu, thứ hai là thuật toán, thứ ba là tỷ lệ băm, nó phụ thuộc vào "sức mạnh tạo nên kỳ tích", tức là sử dụng nguồn lực khổng lồ để đổi lấy sự cải thiện hiệu suất.

Vào tháng 6 năm nay, Giáo sư Trần Dị Nhiên tại Khoa Điện tử và Kỹ thuật Máy tính, Đại học Duke, từng nói với《Tài Chính》rằng đường lối cơ bản của sự phát triển AI vẫn là "sức mạnh tạo nên kỳ tích". Mọi người vẫn đang thảo luận về việc liệu phương thức này trong tương lai sẽ đạt đến đỉnh điểm khi nào, tiềm năng của nó sẽ bị tiêu hao khi nào, giới học thuật cũng đang cố gắng tìm kiếm các con đường mới. Nhưng hiện tại vẫn chưa có phương thức hiệu quả khác, do đó ngành công nghiệp cũng không có nhiều lựa chọn, vẫn đang tiếp tục theo đuổi con đường "sức mạnh tạo nên kỳ tích".

Hiện tại, các công ty công nghệ Trung Quốc, như Qwen 3 của Alibaba được cập nhật vào tháng 7 năm nay đã tạm thời bắt kịp o3 của OpenAI được phát hành vào tháng 4 năm nay. Việc phát hành GPT-5 có nghĩa là một vòng đua bắt kịp mới sắp bắt đầu.

《Tài Chính》được biết, một trong những mục tiêu cốt lõi của bộ phận phát triển mô hình lớn của Alibaba - Thông Nghĩa Thí Nghiệm Phòng năm nay là phải duy trì vị thế dẫn đầu về hiệu năng mô hình, số lượng tải xuống và số lượng các mô hình phái sinh.

CTO (Giám đốc Công nghệ) của Alibaba Cloud, người phụ trách Thông Nghĩa Thí Nghiệm Phòng Chu Tĩnh Nhân, vào tháng 6 năm nay tại buổi phỏng vấn nhóm hội nghị nhà phát triển Mô Đạo, từng nói với《Tài Chính》rằng hiệu năng mô hình phải có đủ sức cạnh tranh, có thể chứng minh năng lực của mình trong các bài kiểm tra chuẩn (Benchmark) có uy tín và được công nhận.

Ông còn đề cập, Thông Nghĩa Thí Nghiệm Phòng luôn coi việc theo dõi và đánh giá xu hướng công nghệ tiên phong toàn cầu là một phần công việc hàng ngày. Họ không chỉ quan tâm đến các bài báo tại các hội nghị hàng đầu về trí tuệ nhân tạo (AAAI, IJCAI, ICML, NIPS và các hội nghị học thuật quốc tế hàng đầu), mà còn theo dõi sát sao các cộng đồng mã nguồn mở toàn cầu, các blog công nghệ và các công ty AI hàng đầu về việc phát hành sản phẩm.

Kỹ sư thuật toán kỳ cựu nói trên cho rằng, trong lĩnh vực các mô hình lớn, bất kỳ lợi thế hiệu năng nào cũng chỉ là tạm thời, cuộc đua tốc độ là liên tục không ngừng.

Bài viết này đến từ trang WeChat "Bán Thục Tài Chính" (ID:Banshu-Caijing), tác giả: Ngô Tuấn Vũ Chu Nguyên, 36kr được ủy quyền phát hành.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận