Ultraman sợ hãi! GPT-5.5 "Garlic" đối đầu trực diện với Google, báo động đỏ được ban hành.

36kr

12-03

Bài viết này được dịch máy

Xem bản gốc

Ba năm trước, ChatGPT đột nhiên xuất hiện.

Lần đầu tiên trải qua cảm giác sợ hãi sâu sắc, Google đã vội vàng phát đi "báo động đỏ".

Nhưng ai có thể ngờ rằng chỉ ba năm sau, "báo động đỏ" này lại được kích hoạt ngay tại trụ sở của OpenAI!

Tổng giám đốc điều hành Altman đã khẩn trương gửi email tới toàn thể nhân viên, trong đó chỉ có một câu:

ChatGPT đang gặp nguy hiểm cận kề.

Ultraman: Chúng ta đang ở thời điểm quan trọng đối với ChatGPT

tên mã là Tỏi

Mô hình bí ẩn của OpenAI được tiết lộ

Lần này đến lượt OpenAI.

Theo Altman, OpenAI có kế hoạch phát hành một mô hình suy luận hoàn toàn mới vào tuần tới.

Đánh giá nội bộ cho thấy mô hình này hoạt động tốt hơn Gemini 3, nhưng vẫn còn nhiều việc phải làm để cải thiện "trải nghiệm " ChatGPT.

Hơn nữa, theo báo cáo mới nhất từ Inforamtion, OpenAI cũng đang phát triển một thế hệ mô hình mới, có tên mã nội bộ là "Garlic".

"Tỏi" đã đạt được bước đột phá lớn trong quá trình huấn luyện trước.

Phiên bản này khắc phục các sự cố trong kiến trúc ban đầu của GPT-4.5 và dự kiến sẽ được phát hành vào đầu năm sau với tên gọi GPT-5.2/GPT-5.5.

Ít nhất là trong thử nghiệm công khai nội bộ, "Garlic" đã vượt trội hơn Gemini 3 và Claude 4.5 Opus của Google trong nhiệm vụ mã hóa và suy luận.

Tuần trước, Giám đốc nghiên cứu Mark Chen đã có bài thuyết trình kín với đội ngũ nội bộ, nội dung chính chỉ có một câu: "Tỏi" đã sẵn sàng!

Trong một cuộc phỏng vấn ngày hôm qua, Mark Chen đã công khai trả lời rằng Gemini 3 là một mô hình mạnh mẽ, nhưng OpenAI đã có một mô hình có thể sánh ngang với nó.

Điều này cho thấy OpenAI đã âm thầm bảo vệ được quân át chủ bài tiếp theo của mình.

Lời gốc của Mark Chen trong nội dung bài viết như sau:

Chúng tôi dự định phát hành phiên bản Garlic sớm nhất có thể. Với tốc độ hiện tại, đừng ngạc nhiên nếu chúng ta thấy GPT-5.2 hoặc GPT-5.5 được phát hành vào đầu năm sau.

Trước đó, không chỉ Information mà cả SemiAnalysis và các hãng truyền thông nước ngoài khác đều đưa tin rằng kể từ GPT-4o, OpenAI vẫn chưa hoàn thành quá trình đào tạo trước cho thế hệ mô hình lớn tiên tiến tiếp theo.

Do những thách thức này, OpenAI buộc phải chuyển trọng tâm sang các mô hình suy luận.

Vào tháng 10, Altman đảm bảo với mọi người rằng OpenAI sẽ phát hành một mô hình ngôn ngữ lớn mới có tên mã là "Shallotpeat" để thách thức Gemini 3 của Google.

Rõ ràng, "Tỏi" và "Hẹ củ" là hai mô hình khác nhau.

Phần trước tích hợp các lỗi đã được sửa trong quá trình phát triển "Shallotpeat" và bước đột phá quan trọng nhất xảy ra trong "giai đoạn tiền đào tạo".

Như đã biết, sự tự tin lớn nhất của Google vào Gemini 3 nằm ở "bước nhảy vọt về chất lượng" đạt được trong giai đoạn tiền đào tạo.

Ngay cả các giám đốc điều hành cấp cao tại OpenAI cũng đã thừa nhận điều này một cách riêng tư.

Tuy nhiên, trong quá trình phát triển "Garlic", OpenAI đã giải quyết được một số vấn đề chính gặp phải trong giai đoạn tiền đào tạo trước đó.

Cải thiện mô hình được đào tạo trước đó "tốt nhất" và "lớn hơn nhiều".

Nói cách khác, GPT-4.5, được phát hành vào tháng 2 năm nay, giống như một hiện tượng nhất thời và hiện đã chìm vào quên lãng.

Về cơ bản, những tối ưu hóa này cho phép OpenAI đưa cùng một lượng kiến thức khổng lồ vào một mô hình nhỏ hơn. Trước đây, điều này chỉ có thể đạt được bằng cách phát triển các mô hình khổng lồ.

Không cần phải nói, việc phát triển một mô hình lớn chắc chắn tốn kém và mất nhiều thời gian hơn so với việc phát triển một mô hình nhỏ!

Mark Chen còn tiết lộ một tin tức thậm chí còn gây chấn động hơn:

Dựa trên kinh nghiệm có được từ "Garlic", OpenAI đã âm thầm ra mắt thế hệ tiếp theo với các mô hình lớn hơn và mạnh mẽ hơn.

Trong hai tuần qua, cộng đồng AI đã tập trung vào Google và OpenAI đã bất thường chuyển sang nhân vật"theo đuổi" thụ động.

Hai tuần sau khi phát hành Gemini 3, số lượng người dùng hoạt động hàng ngày của ChatGPT giảm 6%.

Trước khi có thể xoay chuyển tình thế, OpenAI phải gióng lên hồi chuông cảnh báo!

"Mã đỏ"

Cuộc chiến sinh tồn đã bắt đầu.

Vài tuần trước, OpenAI đã thông báo rằng họ đã chuyển sang trạng thái "báo động cam" để cải thiện ChatGPT.

Bây giờ, mọi thứ còn cấp bách hơn nữa.

Với việc phát hành Code Red, các dự án đã được lên lịch trước đó đã bị hoãn lại.

Việc kinh doanh quảng cáo : Ban đầu tôi muốn kiếm tiền thông qua tìm kiếm, nhưng hiện tại tôi sẽ tạm gác lại.

Trợ lý AI thông minh : những trợ lý đa năng có thể tự động mua vé và đăng ký lịch hẹn khám bệnh, hãy chờ một chút.

Pulse : Sản phẩm được cho là sẽ gửi cho bạn bản tin tóm tắt được cá nhân hóa vào mỗi buổi sáng cũng đã bị hủy bỏ.

Mục tiêu rất đơn giản.

Điều này có nghĩa là sử dụng tất cả tỷ lệ băm, nguồn nhân lực và nguồn tài chính hiện có để phục vụ một mục đích:

Để làm cho ChatGPT tốt hơn nữa.

Hệ thống bảo vệ đang nông dần.

Tại sao lại phải làm tới mức này?

OpenAI phát hiện ra rằng thứ có vẻ là lợi thế không thể vượt qua đang dần bị các đối thủ cạnh tranh xói mòn.

1. Tăng trưởng dường như không còn nhanh như trước:

Trong cuộc gọi hội nghị với các nhà đầu tư, CFO đã ám chỉ rằng một chỉ báo tăng trưởng của ChatGPT đang chậm lại—có thể là số lượng người dùng, thời gian sử dụng, đăng ký, v.v.

2. Cuộc phản công của Google đang ngày càng trở nên đe dọa:

Thế hệ mô hình mới mạnh mẽ này rất hấp dẫn và cả người dùng và nhà phát triển đều không còn chỉ tập trung vào OpenAI nữa.

Việc bổ sung "chế độ AI" vào chức năng tìm kiếm khiến việc tìm kiếm giống như đang trò chuyện với AI.

Sau khi kết hợp nhiều yếu tố, số lượng người dùng hoạt động hàng tháng của Gemini đã tăng từ 450 triệu vào tháng 7 lên 650 triệu vào tháng 10.

Trong một bản ghi nhớ nội bộ, Altman cảnh báo rằng sự trỗi dậy trở lại của Google trong lĩnh vực AI có thể mang lại "những trở ngại kinh tế tạm thời" cho OpenAI.

3. Số tiền phải đốt quá nhiều:

Trong những năm tới, OpenAI sẽ chi hàng trăm tỷ đô la để đào tạo các mô hình mạnh hơn và vận hành ChatGPT.

Ngược lại, thu nhập dự kiến từ đăng ký ChatGPT là: khoảng 10 tỷ đô la trong năm nay, 20 tỷ đô la vào năm tới và 35 tỷ đô la vào năm 2027.

Do đó, để duy trì "cuộc đua đốt tiền" này, OpenAI hy vọng sẽ huy động thêm khoảng 100 tỷ đô la.

Thành công hay không phụ thuộc vào hiệu suất của ChatGPT.

Tóm lại, trong bối cảnh này, bất kỳ sự chậm lại nào tăng trưởng hoặc mất người dùng đều sẽ trở thành "vấn đề sống còn".

1. Cuộc chiến giành số lượng người dùng

OpenAI tuyên bố rằng ChatGPT hiện đang xử lý 70% "hoạt động trợ lý AI" toàn cầu và 10% "hoạt động tìm kiếm".

Mặt khác, Google đã thể hiện tăng trưởng nhanh chóng của Gemini và sự tích hợp độ sâu của công ty này vào danh mục sản phẩm và tìm kiếm của mình.

2. Hệ sinh thái so với phim bom tấn

Con át chủ bài hiện tại của OpenAI là: một ChatGPT cực kỳ mạnh mẽ và phổ biến rộng rãi + một bộ API dành cho nhà phát triển.

Các dịch vụ của Google bao gồm: Tìm kiếm + Email + Tài liệu + Android + Trình duyệt + YouTube + ... + Gemini, toàn bộ hệ sinh thái đều được hỗ trợ bởi AI.

OpenAI dự định đầu tư nguồn lực của mình vào đâu?

Trong bản ghi nhớ, Ultraman đã nêu bật một số lĩnh vực cần được ưu tiên hàng đầu:

Cho phép mọi người tùy chỉnh AI của riêng mình

Ông cho biết ông muốn những người đứng sau 800 triệu người dùng lần cảm thấy rằng đây là "ChatGPT của tôi" chứ không phải là một công cụ chung chung, phổ biến trên thị trường đại chúng.

Nó cho phép người dùng tùy chỉnh : phong cách nói, sở thích, quy trình làm việc và thậm chí ghi nhớ bạn là ai và bạn làm việc như thế nào.

Điều này phù hợp với chức năng "Bộ nhớ" đã đề cập trước đó —AI không chỉ trả lời câu hỏi mà còn "hiểu bạn" trong một thời gian dài.

ChatGPT hiện giống như một nhân viên lễ tân phải giới thiệu lại bản thân lần gặp ai đó.

Trong tương lai, nó sẽ giống như một trợ lý dài hạn hơn: ghi nhớ công việc bạn làm, bạn có bao nhiêu con, bạn sử dụng phong cách nào khi viết mã và giọng điệu nào bạn không thích.

Điều này rất quan trọng để tăng độ bám của người dùng .

Khi một công cụ bắt đầu "hiểu bạn", bạn sẽ ít có khả năng chuyển đổi nền tảng thường xuyên hơn.

Tạo hình ảnh là chiến trường thứ hai

Việc tạo hình ảnh rất quan trọng vì:

Nhiều người có thể không sử dụng ChatGPT để viết các bài viết dài trong một thời gian dài, nhưng họ thường gửi hình ảnh thô ;

Đây là điểm vào quan trọng để kết nối với những người sáng tạo, nhà thiết kế và người dùng thông thường ;

Các mô hình tạo hình ảnh cũng có thể được sử dụng để hỗ trợ nhiều tình huống sản phẩm (thiết kế quảng cáo, trưng bày thương mại điện tử, ý tưởng nghệ thuật trò chơi, v.v.).

Gần đây, Google đã thống trị cộng đồng AI toàn cầu trong nhiều tháng nhờ sự dẫn đầu áp đảo của Nano Banana và Nano Banana Pro.

Do đó, không khó để hiểu tại sao Ultraman lại liệt kê khả năng tạo hình ảnh là một trong những tính năng chính của Code Red.

Chiến thắng trong các trận chiến tinh thần của nhiều bảng xếp hạng công khai khác nhau

"Hành vi mô hình" bao gồm một số điều sau:

Câu trả lời phải chính xác, hữu ích và không vô nghĩa .

Giọng điệu có dễ chịu, không mỉa mai và nhân đạo không?

Liệu có phải là sự cân bằng hoàn hảo giữa an toàn và cởi mở không?

Điều Ultraman muốn là cải thiện đáng kể những "hành vi" này, để người dùng sẵn sàng lựa chọn mô hình đứng sau ChatGPT hơn là các đối thủ cạnh tranh trong bảng xếp hạng công khai như LMARaena.

Bởi vì những loại xếp hạng này có tác động đáng kể đến các nhà phát triển và người dùng thường xuyên , ảnh hưởng đến mô hình họ chọn để xây dựng ứng dụng của mình.

Tốc độ, độ tin cậy và cơ chế loại bỏ

Ngoài ra, Ultraman đặc biệt đề cập đến ba lĩnh vực cần tối ưu hóa:

Thời gian phản hồi nhanh hơn

Độ tin cậy cao hơn

Ít "từ chối quá mức" hơn

Tốc độ là yếu tố quan trọng không chỉ đối với người dùng mà còn đối với nhà phát triển— độ trễ cao có thể phá hỏng hoàn toàn trải nghiệm sản phẩm.

Đồng thời, "từ chối quá mức" cũng là một điểm khó chịu rất điển hình: bạn hỏi một câu hỏi bình thường, nhưng AI lại sợ kiểm soát rủi ro và liên tục nói "Xin lỗi, tôi không thể trả lời câu hỏi này".

Nhiệm vụ tiếp theo của họ là giảm thiểu thương tích do tai nạn cho những người cần giúp đỡ, trong phạm vi an toàn.

điều đó có nghĩa là gì?

Đối với người dùng thông thường, "thời gian + thói quen" họ đầu tư vào một nền tảng sẽ tạo ra cảm giác kết nối mạnh mẽ hơn.

ChatGPT trong tương lai sẽ ngày càng giống một "trợ lý AI cá nhân" hơn là một cỗ máy hỏi đáp công cộng. Nó sẽ hiểu rõ hơn sở thích của bạn, "ghi nhớ" tốt hơn mọi thứ và giống như một người bạn đồng hành lâu dài.

Về mặt trải nghiệm, nó sẽ nhanh hơn, ổn định hơn và ít có khả năng bị từ chối mà không có lý do.

Nếu chúng ta có thể giúp người dùng sử dụng dễ dàng hơn, thì chúng ta có cơ hội tăng sự phụ thuộc của họ vào AI. Nghĩa là, từ "thỉnh thoảng nghịch ngợm" thành "ngày nào cũng dính lấy nó".

Hình ảnh, sự sáng tạo và tính đa phương thức sẽ ngày càng trở nên quan trọng. Điều này không chỉ áp dụng cho "hỏi đáp và viết" mà còn cho toàn bộ quá trình "viết + vẽ + thiết kế + nghiên cứu".

Đối với ngành công nghiệp, trong ngắn hạn, "trải nghiệm tổng hợp" sẽ quan trọng hơn "thông số tổng hợp".

Với các thông số mô hình liên tục được nâng cấp, người dùng thông thường không còn có thể phân biệt được giữa "1 nghìn tỷ thông số" và "2 nghìn tỷ thông số". Tuy nhiên, người dùng có thể ngay lập tức biết được thông số nào mở nhanh hơn, thông số nào ổn định hơn và thông số nào hiểu rõ hơn.

Đối với OpenAI, đây là cuộc chiến "có thể không quyết định sự tồn tại của công ty, nhưng sẽ có tác động rất lớn đến định giá của công ty".

Mục tiêu tài trợ 100 tỷ đô la và hàng trăm tỷ đô la đầu tư vào tỷ lệ băm đều cần một nguồn tiền mạnh và ổn định để hỗ trợ.

ChatGPT chính là con bò đực đó: nó không chỉ cần lưu lượng truy cập mà còn cần cả sự gắn bó và sẵn sàng trả tiền.

Mặt khác, các nhà phát triển và doanh nhân cần phải bắt đầu cân nhắc nên liên kết với "thành trì hệ sinh thái" nào:

Nếu ChatGPT tiếp tục dẫn đầu về trải nghiệm người dùng và danh tiếng, nó sẽ trở thành "nhà máy thủy điện AI" mà mọi người đều mặc định kết nối tới;

Nếu Google và các công ty khác có thể làm cho một số tình huống trở nên dễ dàng hơn, họ chắc chắn sẽ loại bỏ một số ứng dụng mới.

Cuộc chạy đua vũ trang không có hồi kết

Tóm lại: trong lĩnh vực AI, không có ngai vàng vĩnh cửu.

Chỉ ba năm trước, ChatGPT là "kẻ giết rồng" khiến Google thực sự sợ hãi, nhưng giờ đây công ty này đang phải vật lộn để đối phó với sự phản công dữ dội từ đế chế tìm kiếm.

Tuy nhiên, đây chính xác là "cổ tức thời đại" dành cho người dùng thông thường—họ càng sử dụng nó nhiều thì chúng tôi càng thấy thích thú.

Sau tất cả những thử thách và khó khăn, trải nghiệm sản phẩm cuối cùng vẫn là nguyên tắc duy nhất đúng đắn và bền vững.

Tham khảo: HJY

https://www.theinformation.com/articles/openai-ceo-declares-code-red-combat-threats-chatgpt-delays-ads-effort?rc=epv9gi

Bài viết này được trích từ tài khoản WeChat chính thức "New Zhiyuan" , tác giả: New Zhiyuan và được xuất bản với sự cho phép của 36Kr.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan

Bitcoin Sistemi

Liệu mật khẩu Bitcoin của Satoshi (SATS) Nakamoto có thể bị bẻ khóa? Có phải đây là lý do thị trường đang giảm? Công ty phân tích tiết lộ sự thật.

BTC

2.74%

Decrypt

Những chú chim cánh cụt mũm mĩm đến thành phố New York với sự kiện pop-up nhân dịp Ngày Valentine

VALENTINE

Decrypt

Không khí tại "Davos dành cho dân chơi" khi Bitcoin và Ethereum lao dốc.

SOL

0.32%