Điểm chuẩn GPT-5 bị rò rỉ, tin đồn sẽ ra mắt sau hai ngày nữa? Minecraft bản làm lại gây sốc với những bản hack, cư dân mạng gọi là thần thánh

avatar
36kr
07-29
Bài viết này được dịch máy
Xem bản gốc

GPT-5 sắp ra mắt, và nó sẽ ra mắt với một sức mạnh đáng gờm! Các điểm benchmark bị rò rỉ và bài kiểm tra thực tế Minecraft đã khiến cộng đồng mạng phải trầm trồ: GPT-5-pro, tên mã Zenith, hoạt động hoàn hảo trong game, mang lại cho nó biệt danh "AI ma thuật". Tin đồn cũng lan truyền rằng nó sẽ được phát hành vào ngày 31 tháng 7, vượt trội hơn cả Grok 4 Heavy. Liệu OpenAI có sắp làm mưa làm gió một lần nữa?

Sáng sớm, tin tức về GPT-5 lại đến.

Những điểm chuẩn GPT-5 bị rò rỉ này có khả năng là sự thật.

Thậm chí còn có tin tức mới nhất: GPT-5 sẽ được phát hành vào ngày 31 tháng 7.

Vì lý do này, tất cả các mô hình GPT-5 hiện đã chính thức rút khỏi đấu trường WebDev.

Tuy nhiên, có một phát biểu khác từ nhà đầu tư Deedy của Menlo Ventures, cũng như các phương tiện truyền thông nước ngoài như The Verge và The Information, rằng GPT-5 sẽ được ra mắt vào tháng 8.

Mặc dù GPT-5 vẫn chưa ra mắt nhưng các bài kiểm tra thực tế của nó đã có trên khắp Internet.

Vừa rồi, có người đã tung ra bản thử nghiệm GPT-5 mô phỏng trò chơi Minecraft. Chính xác hơn, đó là GPT-5-pro, tên mã nội bộ là Zenith.

Cư dân mạng này bình luận: "Thật ấn tượng, đúng là phép thuật! OpenAI thực sự đã làm được những điều đáng kinh ngạc."

Trong video này, GPT-5 đã hoàn thành nhiệm vụ trò chơi một cách mượt mà và chỉ trong một lần, hiệu suất của nó thực sự đáng kinh ngạc.

Với kỳ vọng của cư dân mạng được nâng cao như vậy, GPT-5 chắc chắn sẽ gây sốt khi chính thức ra mắt, nếu không thì không biết kết cục sẽ ra sao.

Có một tiết lộ chấn động khác từ người tố giác có tiếng Jimmy Apple.

Theo ông, nhiều đánh giá nội bộ đánh giá GPT-5 thậm chí còn tốt hơn Grok 4 Heavy.

GPT-5 sắp ra mắt và mọi người đang nín thở chờ đợi

Bây giờ, mùi hương của GPT-5 đang ngày càng gần hơn.

Một số người thậm chí còn phát hiện ra rằng khi họ chọn o3 trong ứng dụng, họ đã vô tình thử nghiệm một phiên bản GPT-5 nhất định.

Ngày càng có nhiều người vô tình xét nghiệm GPT-5.

Tin tức về việc sản phẩm ra mắt vào tuần này đã được ngày càng nhiều người xác nhận.

Tuyên bố của The Verge hơi khác một chút. Theo thông tin tình báo của họ, GPT-5 sẽ được phát hành vào đầu tháng 8, bao gồm cả phiên bản mini và nano.

Trước đây, một số nhà phát triển đã phát hiện ra rằng GPT-5 được đặt tên nội bộ là "phiên bản alpha lý luận".

Cùng lúc đó, một mẫu máy có tên mã "o3-alpha" đã nhanh chóng hủy niêm yết chỉ 12 giờ sau khi ra mắt . Nhiều người nhận ra đây chính là phiên bản đầu tiên của GPT-5.

Theo thông lệ của OpenAI, khoảng thời gian ngắn nhất từ khi thử nghiệm đến khi phát hành chỉ là 4 ngày, do đó GPT-5 thực sự khá gần.

Mới hôm qua, người ta đã phát hiện ra rằng GPT-5 có thể được sử dụng trên LMArena. Mô hình Zenith cũng được phát hiện cùng lúc.

Những ví dụ sau đây cũng đã được lan truyền rộng rãi trên Internet.

Tạo ra bảng điều khiển tàu vũ trụ từ tương lai xa xôi.

Tạo một trang web phát trực tuyến.

Hoạt ảnh SVG được kết xuất hoàn hảo cho chuyển động đi bộ của robot.

Trò chơi phòng thủ dứa hay nhất từ trước đến nay.

Sê-Ri Fusion o và sê-ri GPT

Không còn nghi ngờ gì nữa, GPT-5 hiện là mẫu xe được mong đợi nhất trên thế giới.

Nhiều người tin rằng GPT-5 sẽ là một cột mốc quan trọng thu hút hàng triệu người dùng tham gia hệ sinh thái AI.

Tiếp theo, chúng ta sẽ phân loại những manh mối khác nhau cho thấy GPT-5 đã được nhắc đến trong thời gian qua.

GPT-5 đã được nhắc đến trong một chương trình phát sóng trực tiếp về các tác nhân thông minh của OpenAI.

Thông điệp chính vào thời điểm đó là mô hình tiên tiến tuyệt vời này sẽ thống nhất hai sê-ri mô hình lần đầu tiên, kết hợp những đột phá của sê-ri O trong lý luận và những đột phá của sê-ri GPT trong đa phương thức.

Vì ChatGPT có nhiều mô hình khác nhau, mỗi mô hình đều có khả năng riêng và tính năng nổi bật, nếu GPT-5 thực sự là tập hợp những điểm tốt nhất của từng mô hình riêng lẻ thì rõ ràng trải nghiệm của người dùng sẽ thay đổi hoàn toàn.

Ví dụ, bất kỳ ai đã từng sử dụng o3 đều biết bước nhảy vọt từ GPT-4o lên o3 điên rồ như thế nào.

Điều này đã được CPO Kevin Weil của OpenAI xác nhận vào đầu tháng 2 năm nay.

Cư dân mạng hỏi: Ông sẽ tạo ra các bộ định tuyến mẫu, hay chúng sẽ được thống nhất hơn theo cách có hệ thống? Weil cho biết sẽ thống nhất hơn

Ngoài ra còn có tiết lộ từ một nhân viên bị nghi ngờ của OpenAI, người này cho biết các nhà nghiên cứu đã thử phương pháp định tuyến, nhưng nó tạo ra rất nhiều ảo giác.

Vì vậy, họ đang thử nghiệm một mô hình có thể lập kế hoạch, lý luận và sử dụng tác nhân như một mở rộng.

Sau đó có một số tiết lộ từ phương tiện truyền thông nước ngoài The Information.

Tóm lại, mã hóa GPT-5 cực kỳ mạnh mẽ.

Trong khoa học tự nhiên, lý luận đi sâu hơn nhiều;

Tự động hóa nhiệm vụ phức tạp trong trình duyệt của bạn;

Văn bản mượt mà hơn và logic trực tuyến hơn;

Quan trọng hơn: có sự cải thiện rất lớn về mặt mã hóa!

Theo một trải nghiệm , GPT-5 không chỉ giải quyết tốt hơn các vấn đề học thuật và thi đấu lập trình mà còn hoạt động tốt hơn khi xử lý nhiệm vụ lập trình thực tế mà các kỹ sư thực tế đối diện .

Ví dụ, nó có thể sửa đổi cơ sở mã phức tạp chứa lượng lớn mã cũ mà không cần lo ngại gì.

Chính khả năng xử lý các tình huống phức tạp một cách tỉ mỉ này đã giúp các mô hình của OpenAI luôn đi sau Anthropic trong quá khứ. Xét cho cùng, trong giới lập trình viên, Claude được công nhận rộng rãi là "vua" thực sự của lập trình.

Sau khi thử nghiệm cá nhân, một trải nghiệm cho biết GPT-5 thậm chí còn vượt trội hơn Claude Sonnet 4 của Anthropic về mặt lập trình!

Nói cách khác, GPT-5 không phải là một mô hình thống nhất mà là một cơ chế định tuyến.

Tùy thuộc vào loại câu hỏi, nó sẽ gửi câu hỏi của bạn đến một mô hình GPT lớn giỏi trò chuyện hoặc một mô hình sê-ri O giỏi về logic và lập luận.

Cuối cùng, hiệu suất của GPT-5 mà chúng ta thấy là kết quả của nỗ lực kết hợp của hai mô hình này.

Thậm chí còn có những giám đốc điều hành của OpenAI đã dự đoán riêng tư rằng:

Chúng tôi tự tin rằng có thể đạt được GPT-8 mà không cần thay đổi kiến trúc.

Nói cách khác, OpenAI không có ý định triển khai một kiến trúc mới, mà thay vào đó dựa vào việc lập lịch thông minh hơn, lập luận mạnh mẽ hơn và nhiều dữ liệu sau đào tạo hơn để từng bước đưa các công nghệ hiện có lên mức cực đại.

GPT-5 sẽ mang lại điều gì cho thế giới?

Đồng thời, tuyên bố của Altman trong một cuộc phỏng vấn gần đây rằng "GPT-5 khiến ông cảm thấy vô dụng" đã làm dấy lên nhiều kỳ vọng hơn từ mọi người.

Một số người còn cho rằng GPT-5 có thể là một trong những thứ nguy hiểm nhất đang diễn ra trong lĩnh vực AI hiện nay.

Ví dụ, Ultraman đã đề cập trong cuộc phỏng vấn lần rằng nhiều người trò chuyện với AI suốt ngày và thậm chí coi nó như bạn trai hoặc bạn gái của mình.

Ngoài ra, còn có một số trẻ em lớn lên chỉ dựa vào việc lướt web để nạp dopamine. Tất cả những điều này đều nguy hiểm.

Khi người dẫn chương trình hỏi: Làm thế nào để ngăn chặn AI gây ra tác động tiêu cực tương tự như mạng xã hội? Altman thành thật thừa nhận: Tôi rất sợ điều này, và tôi không có câu trả lời.

Điều đáng lo ngại là chỉ vài ngày trước, một nhà đầu tư của OpenAI đã thừa nhận rằng anh ta đã gặp một số tình trạng bất thường do sử dụng ChatGPT cả ngày.

Nói cách khác, ngay cả những người giàu cũng có thể bị bệnh tâm thần sau khi trò chuyện với AI.

Altman thậm chí còn bày tỏ sự quan tâm đến việc cung cấp cho mọi người trên Trái Đất một lần chạy GPT-5 miễn phí.

Khi các sản phẩm và dịch vụ AI này được cung cấp với chi phí chỉ bằng 1/100, rõ ràng là một số nền kinh tế sẽ nhanh chóng chuyển đổi và sụp đổ.

Tuy nhiên, bất kể nó gây ra sự điên cuồng nào trên thế giới, GPT-5 hiện không thể ngăn cản trong nỗ lực đưa nó ra mắt.

Tham khảo:

https://x.com/chetaslua/status/1949905375546708242

https://www.youtube.com/watch?v=0jDsWemXi3U

Bài viết này được trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Xinzhiyuan và được 36Kr cho phép xuất bản.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận