Đếm ngược thời gian phát hành GPT-5? Rò rỉ trực tuyến: Microsoft Copilot đang chuẩn bị cho một bước tiến lớn và GPT-5 đang trong giai đoạn nước rút cuối cùng ra mắt.

avatar
36kr
08-01
Bài viết này được dịch máy
Xem bản gốc

Tin tức mới về GPT-5 sắp ra mắt! GPT-5-Alpha đã được đội ngũ Cursor thử nghiệm nội bộ và có thể hoàn thành hầu hết mọi nhiệm vụ chỉ trong một lần. Perplexity đã hoàn tất khâu chuẩn bị cho bản phát hành GPT-5 trên trang web của mình. Các kỹ sư Microsoft cũng đang tích cực làm việc trên GPT-5, dự kiến sẽ sớm được phát hành trong Copilot. GPT-5 đang thực sự đến gần.

Mỗi lần mở mắt, tôi đều cảm thấy GPT-5 đang tiến lại gần hơn một chút.

Vừa rồi, một làn sóng tin tức khác về GPT-5 đã được tiết lộ.

Đầu tiên, GPT-5-Alpha đã được đội ngũ Cursor thử nghiệm nội bộ. Mô hình này hoạt động cực kỳ tốt và có thể giải quyết hầu hết mọi nhiệm vụ chỉ trong một lần.

Ví dụ, mô hình đã hoàn thành thành công thử thách "Trò chơi thủy cung" sau đây.

Và chỉ vài giờ trước, các mô hình GPT-5-Auto và GPT-5-Reasoning đã được phát hiện trong ứng dụng ChatGPT trên macOS.

Một số cư dân mạng tinh mắt đã chú ý đến từ "lý luận" trong thông tin bị rò rỉ và suy đoán rằng điều này chỉ ra rằng GPT-5 có thể đã có mẫu sê-ri O.

Trong khi đó, Perplexity đã hoàn tất việc chuẩn bị cho việc phát hành GPT-5 trên trang web của mình. Sau khi GPT-5 được phát hành, người dùng Perplexity Pro sẽ có thể sử dụng ngay lập tức.

Microsoft đã sẵn sàng phát hành GPT-5 trong bộ AI của mình

Đồng thời, người ta cũng phát hiện ra rằng Chế độ thông minh Copilot của Microsoft sẽ được hỗ trợ bởi GPT-5.

Có một số suy đoán rằng phần bộ định tuyến của GPT-5 có thể đã được triển khai.

Tóm lại, Microsoft đang chuẩn bị phát hành GPT-5 trên toàn bộ bộ AI của mình, bao gồm Copilot (phiên bản dành cho người tiêu dùng) và Microsoft 365 Copilot (phiên bản dành cho doanh nghiệp/người lao động), cũng như Azure (khách hàng doanh nghiệp/API).

Có thông tin cho rằng ứng dụng Copilot dành cho Windows 11 có chế độ "thông minh" có thể chuyển đổi giữa chế độ suy luận/không suy luận của GPT-5 dựa trên truy vấn.

Ngay cả phiên bản miễn phí của Windows 11 Copilot cũng sẽ có chế độ "thông minh" dựa trên GPT-5, do đó GPT-5 sẽ không giới hạn đối với người dùng trả phí.

Các kỹ sư của Microsoft đang làm việc tích cực để chuẩn bị cho GPT-5

Cùng lúc đó, The Verge vừa đăng tải bài viết cho biết Microsoft đang chuẩn bị ra mắt chế độ thông minh Copilot mới của GPT-5.

Theo người trong nội bộ của Microsoft, Microsoft đang thử nghiệm chế độ thông minh của GPT-5 trong phiên bản Microsoft 365 Copilot dành cho người tiêu dùng và thương mại, điều này phù hợp với những tiết lộ trên.

Và người ta nói rằng trong phiên bản dành cho người tiêu dùng, AI ở chế độ này có thể "suy nghĩ độ sâu hoặc nhanh chóng, tùy thuộc vào nhiệm vụ ", do đó người dùng không cần phải chọn mô hình.

Điều này cũng phù hợp với những ý tưởng trước đây được Ultraman tiết lộ.

Altman phát biểu vào tháng 2: "Chúng tôi ghét bộ chọn mô hình này giống như bạn và muốn quay trở lại với sự kỳ diệu của trí tuệ thống nhất".

Đồng thời, GPT-5 cũng sẽ bao gồm cả model o3 thay vì phát hành dưới dạng phiên bản độc lập.

Phóng viên The Verge suy đoán rằng chế độ thông minh này xuất hiện trong Copilot trước thời hạn vì các kỹ sư của Microsoft đang chuẩn bị cho việc phát hành GPT-5.

Tóm lại, nếu quá trình chuẩn bị cho GPT-5 của OpenAI diễn ra tốt đẹp, mô hình thông minh của Copilot sẽ sớm xuất hiện trước mắt mọi người.

Nội dung trên là làn sóng tiết lộ mới nhất ngày hôm nay về manh mối GPT-5.

Một cư dân mạng than thở: Chu kỳ phát triển của các mô hình lớn hiện nay quá nhanh, tốc độ tiếp thị không thể theo kịp tốc độ phát hành.

Nhà nghiên cứu OpenAI: Tôi lại tin vào AGI

GPT-5 hiện đang trên bờ vực của một cơn bão. Vào thời điểm này, nhà nghiên cứu Alexey Guzey của OpenAI đã xuất bản một bài báo có tựa đề "Tại sao tôi lại tin vào AGI".

Trong bài viết này, có lẽ chúng ta có thể hiểu sơ qua về các dấu hiệu khác nhau của GPT-5.

Sau đây là ý chính của bài viết.

Tại sao bây giờ tôi lại tin vào AGI?

Thứ nhất, giờ tôi tin chắc rằng ChatGPT hiểu những gì nó đọc. Thứ hai, mô hình lập luận thuyết phục tôi rằng ChatGPT rất sáng tạo. Thứ ba, ChatGPT tóm tắt văn bản cực kỳ tốt, điều mà tôi cho rằng một thước đo đáng tin cậy về trí thông minh.

Đồng thời, tôi không tin vào “trí thông minh tổng quát”, vì vậy tôi cho rằng khái niệm AGI là vô nghĩa.

Cuối cùng, các sản phẩm AI hiện có thể tài trợ cho nghiên cứu AGI, điều này có nghĩa là AI đã đạt đến giai đoạn đầu của chu kỳ tự cải thiện.

Do đó, nhiều cuộc thảo luận về mốc thời gian cho "AGI" và "siêu trí tuệ" đã lỗi thời.

ChatGPT hiểu những gì nó đọc

Với tôi, AGI là về sự hiểu biết. Liệu ChatGPT có thực sự hiểu không, hay nó chỉ là một căn phòng Trung Quốc ngu ngốc ánh xạ đầu vào thành đầu ra?

Bây giờ tôi cho rằng là nó hiểu rồi.

Điều thực sự thuyết phục tôi là dòng tweet này: Có người chế nhạo mô hình o1 của OpenAI vì không phát hiện ra rằng câu đố logic mà nó đề xuất thực sự có một giải pháp rất đơn giản.

Lần đầu tiên tôi thấy dòng tweet này là vào ngày 24 tháng 9.

Vào tháng 4 năm 2025, tôi lại thấy lỗi này nên tôi thử xem liệu mẫu o3 có mắc lỗi tương tự không?

Kết quả là O3 đã thất bại.

Nhưng rồi tôi nghĩ, nếu mô hình hiểu câu đố nhưng lại không chú ý đủ thì sao? Vậy nên tôi yêu cầu nó đọc kỹ hơn câu đố, và nó đã giải được bài toán.

o3 Khi bạn đọc kỹ, bạn sẽ không gặp khó khăn khi giải một câu đố mới mà bạn chưa từng gặp trước đây.

Hoặc lấy văn bản màu xanh lá cây này từ GPT-3:

Bạn có thể đọc được dòng chữ màu xanh lá cây này và nói ChatGPT là một con vẹt ngẫu nhiên vô nghĩa không? Tôi thì không.

Với tôi, những ví dụ này là bằng chứng rất thuyết phục cho thấy ChatGPT thực sự là một thực thể thông minh và chúng ta đang đạt được những tiến bộ vững chắc trên con đường xây dựng AGI.

Ví dụ, câu hỏi kinh điển "Số nào lớn hơn, 9/11 hay 9/9?"

Chúng ta từng cười AI vì lần này, nhưng gần đây tôi đã suy nghĩ kỹ hơn và cho rằng đây là vấn đề về bối cảnh chứ không phải là vấn đề về trí thông minh.

Trên thực tế, có nhiều trường hợp 9.11 lớn hơn 9.9 (sách, bài báo học thuật, phiên bản phần mềm) và không phải là vô lý khi ChatGPT cho rằng 9.11 lớn hơn 9.9 nếu không cung cấp thông tin nào khác.

Thực tế là mỗi lần tôi chế nhạo ChatGP, sáu tháng sau nó lại chế nhạo tôi, khiến tôi ngày càng khó chấp cho rằng sự ngớ ngẩn của nó.

LLM là sáng tạo

Hoặc: LLM + RL = bước thứ 37 của trí thông minh.

Có người từng hỏi: Chúng ta nên ứng xử thực tế rằng mặc dù các mô hình này đã ghi nhớ hầu hết mọi sự kiện đã biết về thế giới nhưng chúng vẫn chưa có bất kỳ khám phá mới nào?

Việc áp dụng học tăng cường vào chương trình Thạc sĩ Luật (LLM) khiến tôi tin rằng đây không phải là vấn đề, bởi vì bất cứ khi nào học tăng cường hiệu quả, nó đều tìm ra những giải pháp mới mẻ và sáng tạo. Cờ vua. Cờ vây. Toán học. Mô phỏng vật lý. Trò chơi điện tử. Tất cả đều đúng.

RL = Sáng tạo. Đó là mô hình.

Đặc biệt, khi tôi đọc dòng tweet của Karpathy về bước 37, mọi thứ trở nên rõ ràng.

Bước 37 đề cập đến AI được đào tạo thông qua quá trình thử và sai của RL, giúp phát hiện ra các hoạt động mới lạ, đáng ngạc nhiên và có khả năng thông minh ngay cả với các chuyên gia.

Đây là một hiện tượng xuất hiện kỳ diệu, hơi bất ổn, chỉ có thể xảy ra thông qua học tăng cường quy mô lớn. Bạn không thể làm điều đó bằng cách bắt chước các chuyên gia.

Đây chính là cảnh AlphaGo thực hiện nước đi thứ 37 trong ván đấu thứ hai với Lee Sedol. Đó là một nước đi kỳ lạ, với xác suất một người thực hiện được chỉ một phần mười nghìn, nhưng nhìn lại, đó là một nước đi đầy sáng tạo và khéo léo, cuối cùng dẫn đến chiến thắng cho AI.

Hiện nay, với sự xuất hiện của một loạt LLM "có khả năng suy nghĩ" mới (như OpenAI-o1, DeepSeek-R1, Gemini 2.0 Flash Thinking), chúng ta đang bắt đầu thấy những tia sáng đầu tiên của một thứ gì đó tương tự trong lĩnh vực thế giới mở.

Những mô hình này, trong quá trình cố gắng giải quyết nhiều vấn đề toán học/mã/v.v. khác nhau, sẽ khám phá ra các chiến lược tương tự như độc thoại nội tâm của con người mà rất khó (hoặc không thể) lập trình trực tiếp vào mô hình.

Tôi gọi những điều này là “chiến lược nhận thức”—những việc như tiếp cận vấn đề từ nhiều góc độ khác nhau, thử nhiều ý tưởng khác nhau, tìm kiếm sự tương tự, quay lại, xem xét lại tình huống, v.v.

Nghe có vẻ kỳ lạ, nhưng LLM có khả năng khám phá ra những cách suy nghĩ, giải pháp cho các vấn đề, phương pháp kết nối các ý tưởng giữa các ngành học tốt hơn và thực hiện theo những cách mà khi nhìn lại, chúng ta thấy ngạc nhiên, khó hiểu nhưng vẫn sáng tạo và thông minh.

Như X. Dong của Nvidia chỉ ra, “Các mô hình được đào tạo bằng phương pháp học tăng cường đã đạt được tiến bộ to lớn trong việc giải quyết các vấn đề mà các mô hình cơ sở không bao giờ có thể hiểu được dù đã thử bao nhiêu lần.”

Nhiều thập kỷ trước, khi Tyler Cowen chứng kiến AI đánh bại con người trong môn cờ vua, ông cho rằng nó cũng sẽ đánh bại chúng ta trong những hoạt động trực quan khác.

Nén là trí thông minh và khả năng nén của ChatGPT là tuyệt vời

Khi muốn biết ai đó thông minh đến mức nào, tôi thường hỏi họ: QUAN ĐIỂM chính của một bài viết nào đó là gì?

Vấn đề này thực chất yêu cầu phải nén nhiều từ (một bài viết) thành một vài từ (một câu) trong khi loại bỏ mọi nội dung không quan trọng.

Nếu người này có thể làm được điều này, tôi sẽ cho rằng họ là người rất thông minh.

Vì vậy, khi tôi hỏi ChatGPT câu hỏi tương tự và nó thành công trong khi người bạn thông minh nhất của tôi lại thất bại, tôi kết luận: nó thực sự nén tốt và thực sự thông minh.

(Điều này tương tự với quan điểm khả năng dự đoán có liên quan chặt chẽ đến chỉ báo thông minh. Tôi cho rằng nén và dự đoán là hai mặt của một đồng xu, do đó, bằng cách học cách dự đoán từ tiếp theo trong quá trình đào tạo, ChatGPT cũng tự nhiên học được cách nén văn bản tốt.)

Tại sao tôi cho rằng ý tưởng về AGI là ngu ngốc

Bởi vì tôi không tin vào “trí thông minh tổng quát”. AGI thường được định nghĩa theo cách nào đó liên quan đến con người, và tôi cho rằng mình thuộc một dạng trí thông minh rất hạn hẹp.

Ví dụ, tôi không thể tính được 3289 nhân 5721. Thực tế, tôi thậm chí còn không thể tính được 328 nhân 572! Tôi chỉ có thể tính được 32 nhân 57, và tôi thường tính sai 20%.

Tôi chỉ có thể hiểu được lý do tại sao bạn gái tôi tức giận khoảng 10% thời gian, nhưng phần lớn thời gian, tôi cũng chẳng giỏi việc này lắm.

Tôi có trí thông minh tổng quát không? Với tôi, câu trả lời rõ ràng là không.

Thỉnh thoảng tôi có thể học được cách làm một vài việc. Tôi có thể học thêm bằng cách bắt chước người khác hoặc sử dụng máy tính. Nhưng chỉ vậy thôi.

Nền văn minh nhân loại và những tiến bộ công nghệ của chúng ta không được thúc đẩy bởi bất kỳ loại trí thông minh tổng quát nào! Thay vào đó, chúng được thúc đẩy bởi khả năng học cách làm việc này ở đây và làm việc khác ở kia.

Không quan trọng AGI có tồn tại hay không

(Thật thú vị, tôi đã đọc được quan điểm này trong một bài đăng trên blog gần đây của Altman.)

Trong nhiều thập kỷ—và cho đến tận vài năm trước—việc tài trợ cho nghiên cứu AGI đều dựa vào ước mơ và viễn cảnh mong đợi.

Đây là lý do tại sao ngành công nghiệp AI đã trải qua những đợt suy thoái định kỳ; đây là lý do tại sao không có công ty AGI nào tồn tại được quá vài năm; và đây là lý do tại sao AGI từng là một thuật ngữ miệt thị gắn liền với "nhóm điên rồ", như những đồng sáng lập DeepMind đã nói.

Ngày nay, lần đầu tiên, giá trị kinh tế do nghiên cứu AGI tạo ra đủ để hỗ trợ các nghiên cứu AGI tiếp theo. Hàng trăm triệu người sử dụng ChatGPT mỗi ngày, và hàng triệu người khác trả tiền cho nó.

Các sản phẩm AI trả tiền cho nghiên cứu AGI vì chúng hữu ích với chúng ta.

Nếu không có con người, AI không thể tạo ra giá trị kinh tế, bởi vì bản chất của giá trị kinh tế nằm ở những gì con người cho rằng có giá trị. Do đó, khả năng tự cải thiện của AI hoàn toàn phụ thuộc vào việc nó có tiếp tục hữu ích với chúng ta hay không.

Sự tiến triển của AI diễn ra suôn sẻ hơn bất kỳ ai mong đợi và "tính hữu ích" của nó dựa nhiều hơn vào các cấu trúc phụ trợ không thông minh hơn bất kỳ ai mong đợi.

Vậy nên tôi cho rằng việc chúng ta xây dựng "AGI" hay "siêu trí tuệ" thực sự không còn quan trọng nữa. Nghiên cứu AI có thể tự duy trì = AI đã có mặt và sẽ tiếp tục được cải thiện.

Tôi thường nghĩ về những công nghệ trong quá khứ đã thực sự thay đổi thế giới.

Ví dụ, máy in đã định hình lại hoàn toàn thế giới từ thế kỷ 16 đến thế kỷ 19, khởi đầu cho cuộc Cải cách Cơ đốc giáo, Chiến tranh Trăm năm, sự hình thành nhà nước dân tộc hiện đại, và cuối cùng là các cuộc Cách mạng Khoa học và Công nghiệp. Bản thân công nghệ đó không hề chứa đựng trí tuệ.

Nhưng nó đã thay đổi cách truyền tải thông tin, tăng đáng kể sức mạnh của ý tưởng và giá trị của khả năng đọc viết, đồng thời mang lại cho chúng ta những khả năng mới mạnh mẽ trong việc theo đuổi mục tiêu của mình.

Trí tuệ nhân tạo (AI) đã tăng cường đáng kể khả năng tác động đến thế giới của chúng ta, cả về mặt cá nhân lẫn tập thể. Cách chúng ta sử dụng sức mạnh này hoàn toàn phụ thuộc vào chính chúng ta.

Tham khảo

https://x.com/testingcatalog/status/1950197904024436812

https://x.com/testingcatalog/status/1950534140974993578

https://x.com/WindowsLatest/status/1950641135602610466

https://www.theverge.com/notepad-microsoft-newsletter/715849/microsoft-copilot-smart-mode-testing-notepadhttps://x.com/alexeyguzey/status/1950632413870305637

Bài viết này trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Aeneas và được 36Kr cho phép xuất bản.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận