Các giám đốc điều hành của OpenAI tiết lộ: Khả năng mở rộng sẽ tiếp tục, "đào tạo trục kép" của GPT-5 phá vỡ giới hạn của trí thông minh

avatar
36kr
08-20
Bài viết này được dịch máy
Xem bản gốc

Những tiến bộ và tầm quan trọng của khả năng GPT-5 là gì? Tương lai của trí tuệ nhân tạo sẽ đi về đâu? Mô hình mới tuyệt vời này của OpenAI hé lộ những dạng thức trí tuệ đa dạng như thế nào?

Giám đốc điều hành của OpenAI, Brad Lightcap đã tiết lộ câu trả lời cho những câu hỏi này trong một cuộc trò chuyện độ sâu.

Điều gì làm cho GPT-5 trở nên đặc biệt?

GPT-5 đã đạt được một bước đột phá rất thú vị: nó có thể tự quyết định xem có nên thực hiện suy luận độ sâu trước khi trả lời hay không.

Trước đây, người dùng phải tự tay chọn mô hình cho nhiệm vụ khác nhau thông qua bộ chọn mô hình của ChatGPT. Sau khi đặt câu hỏi, đôi khi bạn sẽ chọn chế độ suy nghĩ, đôi khi thì không. cho rằng rằng trải nghiệm này có thể gây nhầm lẫn.

GPT-5 đơn giản hóa đáng kể quy trình này. Nó không chỉ tự động hóa các quyết định của bạn mà còn thông minh hơn. Trong các lĩnh vực như viết lách, lập trình và sức khỏe, GPT-5 mang lại độ chính xác được cải thiện, phản hồi nhanh hơn và nâng cấp toàn diện trải nghiệm nói chung.

Mọi người đều nghĩ rằng trí thông minh của GPT-5 sẽ tăng trưởng, vậy tại sao OpenAI lại chọn tính tiện dụng thay vì cải thiện trí thông minh làm điểm bán hàng chính?

Brad Lightcap giải thích rằng điều này là do trí thông minh vốn dĩ được xác định bởi lượng thời gian mà mô hình dành cho việc suy nghĩ.

Càng dành nhiều thời gian để suy nghĩ, chất lượng câu trả lời càng cao - đó là quy tắc cơ bản. Khi các mô hình được phép suy nghĩ dựa trên một số chuẩn mực nhất định, AI sẽ vượt trội hơn hẳn tất cả các mô hình hiện có.

Ngay cả khi không bật thời gian suy nghĩ, câu trả lời mà nó đưa ra thường tốt hơn so với các mô hình không suy nghĩ như GPT-4.1.

Do đó, đây là một bước tiến vượt bậc về mọi mặt của trí tuệ. Tuy nhiên, chìa khóa nằm ở khả năng phân bổ thời gian suy nghĩ một cách linh hoạt - điều mà OpenAI cho rằng là cốt lõi để cải thiện trải nghiệm người dùng.

Loại tiến bộ này khó có thể định nghĩa đơn giản là "tăng theo cấp số nhân" hay "tăng dần".

Chúng ta hiện đã bước vào giai đoạn cần đánh giá trí thông minh từ nhiều chiều hướng - OpenAI không né tránh vấn đề này mà đang giải thích lý do tại sao GPT-5 lại đặc biệt như vậy.

Các khả năng cốt lõi của nó đã được cải thiện đáng kể: điểm số SWEBench tăng lên, và nhiều đánh giá học thuật cũng cho kết quả tốt hơn. OpenAI cũng đã tăng cường hiệu suất chuẩn của GPT-5 trong lĩnh vực y tế.

Nhưng ngày nay, tiêu chí để đánh giá chất lượng mô hình đã trở nên rất đa dạng.

Tùy thuộc vào phương pháp đào tạo và cơ chế giải quyết vấn đề, chúng ta có thể đánh giá từ nhiều góc độ:

- Tốc độ tự nó là chất lượng : khả năng đưa ra câu trả lời tốt hơn trên mỗi đơn vị thời gian suy nghĩ tự nó là một chỉ báo sự tiến bộ

- Nâng cấp khả năng vô hình : cải thiện toàn diện các khả năng cơ bản như tư duy có cấu trúc, phân tích vấn đề và gọi công cụ

Ở tất cả các khía cạnh này, GPT-5 vượt qua các phiên bản tiền nhiệm của nó.

Luật mở rộng quy mô chưa chết

Lần bước nhảy vọt từ GPT-1 lên GPT-2, GPT-3, rồi đến GPT-4, khả năng đều được cải thiện toàn diện.

Hồi đó, “mô hình lớn hơn = mô hình tốt hơn trên mọi phương diện”. Điều đó dường như không đúng với GPT-5. Vậy, tình hình đã thay đổi chưa?

Brad Lightcap cho biết: “Về mặt công nghệ, mọi thứ chắc chắn đã thay đổi”.

Từ GPT-2 đến GPT-3, rồi đến GPT-3 đến GPT-4, lợi thế chính là mô hình mở rộng quy mô vào thời điểm đó. Quy mô đào tạo mô hình càng lớn thì mô hình càng tốt.

Nguyên tắc tương tự vẫn đúng, nhưng hiện nay có một loại hình đào tạo khác, đào tạo sau, sử dụng khả năng tính toán thời gian kiểm tra theo những cách thú vị hơn, gần giống như giai đoạn đào tạo thứ hai.

Điều này tạo ra động lực cho phép OpenAI đưa các mô hình lên một tầm cao mới về trí thông minh đồng thời đào tạo "những người thông minh".

Ví dụ, việc sử dụng các công cụ rất quan trọng đối với trí tuệ tổng thể. GPT-2 và GPT-3 không thực sự tốt ở điểm này. GPT-4 còn rất thô sơ về mặt này. Giờ đây, GPT-5 đã tích hợp sẵn những khả năng này, kết hợp các quy trình suy luận nhiều bước và dài hạn hơn.

Bây giờ khi các phương pháp đào tạo đã bắt đầu thay đổi, liệu OpenAI có cho rằng rằng việc đào tạo trước có lợi nhuận giảm dần không?

Brad Lightcap nhấn mạnh rằng họ không cho rằngđào tạo trước sẽ có lợi nhuận giảm dần.

Định luật mở rộng vẫn đúng. Nhìn lên, không có lý do gì cho rằng việc đào tạo trước sẽ có lợi nhuận giảm dần.

Khi nói đến hậu đào tạo, chúng ta mới chỉ bắt đầu khám phá mô hình mới này. sê-ri, các mô hình suy luận trước đây, chỉ là điểm khởi đầu để OpenAI khám phá hậu đào tạo.

Brad Lightcap cho rằng rằng trọng tâm chính trong một hoặc hai năm tới sẽ là tiếp tục mở rộng quy mô ở giai đoạn sau đào tạo để tiếp tục đạt được lợi nhuận đáng kể. Vì lợi nhuận này rất đáng kể, chúng tôi hiện đang cải thiện các mô hình theo hai hướng: trước đào tạo và sau đào tạo . Điều này sẽ thúc đẩy sự đổi mới.

Hầu hết những cải tiến từ nay trở đi sẽ đến từ việc mở rộng quy mô hay thuật toán?

Brad Lightcap cho biết đó luôn là cú đấm kết hợp.

Thuật toán, quy mô, sức mạnh tính toán và dữ liệu— tất cả đều thiết yếu. Nhìn về tương lai, OpenAI cần tập trung vào tất cả những lĩnh vực này.

Dĩ nhiên, phần khó nhất là làm sao để chúng hòa trộn hoàn hảo . Việc huấn luyện các mô hình lớn hơn thường đồng nghĩa với việc sử dụng nhiều dữ liệu và sức mạnh tính toán hơn. Đây là một sự cân bằng tinh tế, vì việc chỉ tăng kích thước không phải lúc nào cũng mang lại kết quả cải thiện tương tự. Bạn cũng phải cân nhắc các yếu tố khác.

OpenAI không chỉ nhấn nút mà còn thực sự dồn hết tâm huyết để kết hợp tất cả những điều này lại với nhau.

GPT-5 quá mạnh

Nhưng nó không được gọi là "AGI"

Altman phát biểu trên podcast của Theo Von rằng: "GPT-5 thông minh hơn con người ở hầu hết mọi mặt".

Nghe có vẻ giống với những gì ông ấy hình dung về AGI. Có vẻ như ông ấy muốn gọi nó là AGI, nhưng OpenAI không nói rõ như vậy. Vậy tại sao GPT-5 lại không phải là AGI?

Brad Lightcap giải thích: “AGI thực sự rất khó định nghĩa.”

Có một câu chuyện cười rằng nếu bạn hỏi năm người AGI là gì, bạn sẽ nhận được bảy câu trả lời khác nhau.

ứng xử AGI là AGI là một quá trình tích lũy, một hệ thống. Bạn phải định nghĩa hệ thống này là gì và bạn mong đợi nó có thể làm được gì.

Đối với Brad, ít nhất, AGI là một hệ thống có thể liên tục học hỏi những điều mới (ngay cả khi chúng vượt quá phạm vi phân phối đào tạo của nó). Khả năng này bắt nguồn từ khả năng lập luận, tư duy, giải quyết vấn đề, sử dụng công cụ và đưa ra ý tưởng mới. Tuy nhiên, ông không cho rằng GPT-5 là AGI: những gì chúng ta bắt đầu thấy trong GPT-5 và các mô hình tiếp theo chỉ là một số nguyên mẫu và mô-đun của "hệ thống học tập tổng quát" này.

Cũng rất khó để xác định ranh giới giữa AGI và phi AGI. Ngay cả khi khoảnh khắc đó xảy ra, cũng khó có ai nhận ra ngay lập tức. Lý do là khi làm việc với các mô hình này, có một "năng lực dư thừa" đáng kể. Mức độ thông minh mà Altman mô tả là "bác sĩ trong túi" vẫn chưa được khai thác hết.

Theo một nghĩa nào đó, ngay cả khi sự phát triển của AI phải tạm dừng trong mười năm, chúng ta vẫn có khoảng mười năm để xây dựng các sản phẩm mới và vẫn có phương pháp mới để kết hợp các mô hình ở cấp độ GPT-5 vào các sản phẩm và quy trình thú vị.

Một hiện tượng thú vị là mô hình càng thông minh thì nhà thiết kế sản phẩm càng cần đầu tư nhiều hơn vào cách tích hợp mô hình đó vào hệ thống.

Brad Lightcap thường sử dụng phép so sánh:

Các thực tập sinh rất thông minh, nhưng cuối cùng họ chỉ làm những công việc hạn chế: ghi chép cuộc họp, viết tóm tắt và thực hiện phân tích cơ bản.

Nhưng nếu bạn mời một tiến sĩ, kỹ năng của họ rất rộng, nhưng có thể chưa phát huy hiệu quả ngay trong ngày đầu tiên. Nhiệm vụ của bạn là cung cấp cho họ bối cảnh, thông tin và công cụ để tối đa hóa giá trị của họ theo thời gian. Quá trình này mất nhiều thời gian hơn so với việc giúp thực tập sinh bắt kịp tiến độ.

Ông cho rằng mô hình AI cũng tương tự. Đây là một quá trình liên tục và sẽ không tuyến tính.

Điều này đặt ra một câu hỏi cực kỳ thú vị: từ giờ trở đi, liệu việc tiếp tục làm cho mô hình thông minh hơn có còn ý nghĩa không? Hay chúng ta nên xây dựng các khả năng phụ trợ? Vậy đối với OpenAI, mục tiêu tiếp theo là tiếp tục nâng cao trí tuệ, hay tập trung vào những khả năng "phi trí tuệ" đó?

Brad Lightcap cho biết anh muốn tất cả chúng.

Một phần là IQ thuần túy: khả năng nhớ lại thông tin về cách thức hoạt động của mọi thứ.

Nhưng cũng có khả năng lý luận:

Cách sử dụng các công cụ khác để giải quyết vấn đề;

Khả năng phản xạ: Xem lại Chuỗi suy nghĩ của mình và kịp thời sửa chữa khi bạn cảm thấy mình đã đi sai đường hoặc chưa nghĩ ra chiến lược đúng đắn.

Về những vấn đề này, GPT-5 tốt hơn các hệ thống trước đây.

Đối với OpenAI, các tiêu chuẩn thực tế ngày càng trở nên quan trọng như một dấu hiệu của trí thông minh, thậm chí còn quan trọng hơn cả các tiêu chuẩn học thuật.

Và "học tập liên tục" chắc chắn là một trong những ưu tiên của OpenAI.

Lần đầu tiên sử dụng AI lý luận

Người dùng không bị sốc

Ethan Mollick của Wharton, người đã thử nghiệm GPT-5 từ sớm, đưa ra một quan điểm thú vị:

Nếu bạn theo dõi đường cong phát triển này, có thể nói sự tiến triển của GPT-5 là một bước nhảy vọt lớn, nhưng cũng là bước nhảy vọt bất ngờ.

Ông cũng đề cập: "Những mô hình này đã giành được huy chương vàng tại kỳ thi Olympic Toán học. Tôi ngày càng thấy khó hiểu những tiến bộ to lớn này thực sự có ý nghĩa gì."

Ngày nay, mọi mô hình đều được cải thiện nhanh chóng, vì vậy vấn đề là nếu bạn có một mô hình thực hiện sinh học ở trình độ đại học, rồi sau đó tiến tới trình độ sau đại học, thì người dùng chatbot trung bình có thể không nhận thấy sự thay đổi, mặc dù nó đã trở nên thông minh hơn.

Một số người cho rằng đối với những người dùng ChatGPT nhiều, sự cải thiện lần sẽ đáng chú ý, nhưng có thể chỉ là cải thiện nhỏ.

Nhưng đối với người dùng thông thường, đặc biệt là người dùng miễn phí, đây sẽ là một bước tiến vượt bậc. Hầu hết người dùng miễn phí chưa từng trải nghiệm sức mạnh của các mô hình suy luận. Họ chủ yếu sử dụng GPT-4.0 và chủ yếu thực hiện các cuộc trò chuyện ngắn theo lượt như tìm kiếm, vốn không thể hiện đầy đủ khả năng của mô hình.

Vì vậy, đối với nhiều người, đây sẽ là lần đầu tiên họ sử dụng một mô hình có khả năng suy luận. Hơn nữa, đây cũng là lần đầu tiên họ trải nghiệm mô hình "tự phản ánh": dựa trên độ khó của câu hỏi, mô hình GPT-5 sẽ tự quyết định thời gian suy nghĩ và chất lượng câu trả lời.

Thực ra đây là một điều tốt - nếu bạn đang theo đuổi AI tốt nhất, bạn sẽ thấy choáng ngợp, nhưng tiến trình sẽ diễn ra liên tục hơn. Nếu bạn đã sử dụng mô hình tốt nhất từ ​​một hoặc hai năm trước, bước nhảy vọt lần sẽ gây sốc.

Điểm khởi đầu của mỗi người đều khác nhau và đó chính là điều thú vị - đây là trải nghiệm rất riêng tư đối với mỗi người.

GPT-5 đặc biệt tập trung vào lĩnh vực y tế vì đây là một trong những điểm khởi đầu phổ biến nhất để người dùng tương tác với AI, đặc biệt là khi nói đến các vấn đề sức khỏe. Đây là một mục tiêu quan trọng của OpenAI.

Hai kịch bản hạ cánh chính

Sức khỏe và Kinh doanh

Brad Lightcap cho rằng AI sẽ không thay thế được bác sĩ:

Mọi người vẫn cần phải làm việc với bác sĩ đa khoa hoặc bác sĩ chuyên khoa để điều trị.

Nhưng việc có một công cụ hướng dẫn bạn trong suốt quá trình có thể rất hữu ích đối với nhiều người và có thể giúp ích trong nhiều tình huống.

OpenAI luôn tập trung vào việc cải thiện khả năng của các mô hình trong lĩnh vực y tế.

Bắt đầu từ GPT-5, độ chính xác của các mô hình trong tương lai sẽ tiếp tục tăng và tỷ lệ ảo giác sẽ tiếp tục giảm.

Cụ thể, GPT-5 có độ chính xác cao hơn khoảng 4 đến 5 lần so với phiên bản trước đó (tùy thuộc vào cách đo).

Theo nhiều cách, chúng ta vẫn chưa thấy “khoảnh khắc ChatGPT” dành cho AI trong doanh nghiệp.

So với người tiêu dùng, AI đặt ra những khó khăn khác nhau cho doanh nghiệp.

Các quy trình doanh nghiệp rất phức tạp, sự phụ thuộc giữa nhiều người dùng là phổ biến, phải xử lý lượng lớn ngữ cảnh và phải sử dụng nhiều công cụ. Các công cụ này phải được sử dụng tuần tự, theo những cách nhất định và trong những ràng buộc nhất định. Khi chúng gặp sự cố, khả năng chịu lỗi bị hạn chế.

Chỉ khi năng lực cơ bản được cải thiện thì AI mới có thể đóng vai trò trong lĩnh vực doanh nghiệp, bao gồm khả năng sử dụng công cụ, suy nghĩ có tổ chức, giải quyết vấn đề, tự sửa lỗi và thực hiện truy xuất ngữ cảnh dài.

Những khả năng này thực sự quan trọng ở biên giới.

OpenAI đã hợp tác với một số công ty để thử nghiệm các mô hình này, đặc biệt là GPT-5 và đã nhận được rất nhiều phản hồi từ các công ty như Uber, Amgen, Harvey, Cursor, Lovable, JetBrains và các công ty khác.

Các công ty như Cursor, JetBrains, Windsurf và Cognition đều báo cáo rằng GPT-5 hiện được coi là mô hình mã hóa mạnh mẽ nhất, cả trong hoàn cảnh mã hóa tương tác và trong hoàn cảnh mã hóa dựa trên tác nhân.

Ngoài ra, khả năng lập luận và giải quyết vấn đề của GPT-5 trong các lĩnh vực khác cũng được cải thiện đáng kể.

Harvey AI là một ví dụ điển hình. Harvey AI hợp tác với các công ty luật, những đơn vị rất tin tưởng vào khả năng phân tích vụ án một cách đáng tin cậy, chính xác và nhất quán của mình, mang lại mức độ tư duy có cấu trúc cần thiết cho việc phân tích pháp lý.

GPT-5 hiện đã rất mạnh mẽ và chắc chắn sẽ có những mô hình tốt hơn trong tương lai.

Nhưng hiện tại, OpenAI chỉ tập trung vào hai điều: làm thế nào để nhiều người có thể sử dụng GPT-5 hơn và làm thế nào để hỗ trợ các đối tác phát triển hệ sinh thái dựa trên GPT-5.

Chúng tôi vẫn đang trong giai đoạn khám phá khoa học - đây là phần thú vị nhất, giống như trò chơi mới chỉ bắt đầu và bản thân OpenAI vẫn đang tìm hiểu mô hình hiện tại.

GPT-5 là bước khởi đầu quan trọng. Chỉ khi nhận thức được tình hình hiện tại, chúng ta mới có thể nhìn rõ tương lai.

Tham khảo:

https://www.bigtechnology.com/p/799049c8-5054-45c0-8ee7-9de1f2191759

Bài viết này được trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Xinzhiyuan, biên tập viên: KingHZ và được 36Kr cấp phép xuất bản.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận