OpenAI sử dụng GPT-5.2 để "phản công" Google. Liệu "con dao" này có đủ sắc bén?

avatar
36kr
12-12
Bài viết này được dịch máy
Xem bản gốc

Sam và Pichai đang đấu vật tay; hình ảnh được tạo ra bằng trí tuệ nhân tạo.

Một tháng trước, Gemini 3 của Google vượt qua tất cả các đối thủ để trở thành "tốt nhất thế giới". Một tháng sau, vào ngày kỷ niệm 10 năm thành lập OpenAI (11 tháng 12, giờ Mỹ), mô hình AI thế hệ mới GPT-5.2 đã chính thức được ra mắt.

Trước thềm sự kiện ra mắt sản phẩm quan trọng này, Ultraman đã ban hành "cảnh báo đỏ" cấp cao trong nội bộ công ty để đối phó với các nỗ lực phát triển sản phẩm và thu hút nhân tài từ các đối thủ cạnh tranh chính.

Do đó, việc ra mắt GPT-5.2 không chỉ liên quan đến địa vị thị trường của hai gã khổng lồ công nghệ, mà còn có thể định hình lại cục diện cạnh tranh của ngành công nghiệp trí tuệ nhân tạo toàn cầu.

Matt Schumer, đồng sáng lập kiêm CEO của HyperWrite, người đã tiến hành "thử nghiệm nội bộ" sớm hơn dự kiến ​​hai tuần, nhận xét: "Nó có khả năng mạnh mẽ, đặc biệt là khả năng suy luận, nhưng nó chậm và các kịch bản sử dụng quá hạn chế. Nó chỉ có thể được sử dụng thông qua ChatGPT."

"Đây là mẫu máy tốt nhất trên thế giới. Nó có thể xử lý các vấn đề khó khăn trong vòng một giờ và hoàn thành nhiệm vụ một cách xuất sắc. Tôi không thể sống thiếu nó."

Chuyên gia AI Ellie Miller của Thung lũng Silicon, đồng thời là một "người thử nghiệm phiên bản beta", định nghĩa GPT-5.2 là một "nhà nghiên cứu chuyên nghiệp": "nghiêm túc" và "chuyên nghiệp" trong tư duy độ sâu và giải quyết các vấn đề phức tạp, nhưng nội dung được cấu trúc và không thân thiện lắm với người dùng, đặc biệt là những người thích giao tiếp nhanh chóng, ngắn gọn và giống con người hơn.

“Đối với các tác vụ phức tạp, việc lên ý tưởng và phân tích chuyên sâu, tôi có lẽ sẽ sử dụng GPT-5.2.”

Nhà phát triển AI Dp Singh đồng ý với đánh giá trên, nhấn mạnh rằng lần đầu tiên, AI có thể đạt được hiệu suất ở cấp độ chuyên gia trong nhiệm vụ chuyên môn hàng ngày (như tạo ra bài thuyết trình, bảng tính và phân tích biểu đồ) , chứ không chỉ trong các tình huống trình diễn.

Những năng lực chuyên môn mà GPT-5.2 thể hiện, ngang tầm với các nhà nghiên cứu con người, cũng đã thu hút sự chú ý của các chuyên gia học thuật.

"Tôi chưa bao giờ chắc chắn đến thế rằng ngay cả khi việc phát triển trí tuệ nhân tạo dừng lại ngày hôm nay, xã hội và nền kinh tế vẫn sẽ phải đối mặt với những thay đổi to lớn trong 10 năm tới bởi vì con người sẽ tìm ra cách tận dụng khả năng của các mô hình," Ethan Morlick, giáo sư tại Trường Wharton thuộc Đại học Pennsylvania và là chuyên gia về trí tuệ nhân tạo, cho biết.

01 OpenAI không thể "đi trước quá xa"

OpenAI có một tầm nhìn rõ ràng cho GPT-5.2: đó là "mô hình phù hợp nhất cho việc sử dụng chuyên nghiệp trong thực tế tính đến thời điểm hiện tại".

Chỉ báo chứng minh "khả năng" của nó là các bài kiểm tra chuẩn và điểm số hiệu suất.

Hình ảnh phía trên là biểu đồ kiểm tra hiệu năng mà OpenAI đã giới thiệu trên X (biểu đồ này thậm chí không được đưa vào thông cáo báo chí chính thức ).

Như có thể thấy, trong bài kiểm tra chuẩn GDPval do chính GPT-5.2 phát triển, GPT-5.2 đã đạt hoặc vượt qua trình độ của các chuyên gia hàng đầu trong 70,9% nhiệm vụ cụ thể, một bước tiến đáng kể so với phiên bản GPT-5 phát hành hồi tháng 8 (38,8%), và cũng vượt trội hơn Claude Opus 4.5 của Anthropic (59,6%) và Gemini 3 Pro của Google (53,5%).

Tuy nhiên, GDPval là bài kiểm tra chuẩn nội bộ của OpenAI, vì vậy nếu nó hoạt động không tốt thì sẽ có vấn đề.

Quan trọng hơn, có rất nhiều tiêu chuẩn đánh giá trong ngành. OpenAI đã trích dẫn trong đó loại tiêu chuẩn đánh giá khác nhau lần , trong khi Google đã trích dẫn khoảng 20 tiêu chuẩn đánh giá trong Gemini 3. Điều này cho phép chúng ta linh hoạt – chúng ta có thể đưa vào bất kỳ dữ liệu tiêu chuẩn nào mà chúng ta có kết quả tốt nhất và loại bỏ phần còn lại.

Tuy nhiên, nếu chuyển bảng trên thành biểu đồ đường, ta có thể thấy rõ rằng trong nhiều bài kiểm tra hiệu năng, sự khác biệt giữa các mô hình tiên tiến nhất từ ​​các công ty khác nhau sử dụng GPT-5.2 mới được OpenAI phát hành là không đáng kể.

Có thể nói rằng cuộc đua trí tuệ nhân tạo đã phát triển từ độc quyền giữa OpenAI thành một cuộc chiến hỗn loạn bên long gã khổng lồ.

Tờ New York Times cũng đề cập đến quan điểm này, trích dẫn các chuyên gia trong ngành quan điểm rằng "khoảng cách công nghệ giữa mô hình nền tảng trí tuệ nhân tạo của OpenAI và các mô hình của các công ty khác thực sự đã biến mất."

Nếu các bài kiểm tra hiệu năng không đủ trực quan, bạn có thể xem các ví dụ cụ thể. Hình ảnh bên trái bên dưới là trang web "Wave Simulator" do chính thức cung cấp, và hình ảnh bên phải là trang được tạo ra trong Gemini với cùng các lệnh điều khiển. Nhìn chung, mỗi công cụ đều có những ưu điểm riêng.

Như đã đề cập trước đó, do áp lực không ngừng từ các đối thủ cạnh tranh, Ultraman đã phát đi "báo động đỏ" trong nội bộ công ty.

Dựa trên sự khác biệt giữa GPT 5.2 và các sản phẩm cùng loại, ước tính rằng "cảnh báo đỏ" sẽ không được loại bỏ ở cấp độ sản phẩm và model trong thời gian ngắn.

Về vấn đề này, Figi Simo, CEO của mảng việc kinh doanh ứng dụng (người được Altman chiêu mộ), cho biết: "Cảnh báo đỏ là tín hiệu cho công ty biết rằng chúng ta cần tập trung nguồn lực vào một lĩnh vực cụ thể; đó là một cách để ưu tiên hóa."

Tóm lại, báo động đỏ không phải là tình huống sống còn, mà chỉ là cách để ban quản lý thể hiện quyết tâm và định hướng hành động. Trên thực tế, GPT-5.2 đã được phát triển trong nhiều tháng; chỉ là thời điểm này được chọn để phát hành mà thôi.

Câu hỏi đặt ra là, nếu xét đến vấn đề sống còn của một công ty, ngoài GPT-5.2 vốn không thực sự mang lại nhiều lợi thế cạnh tranh, liệu Ultraman có USD nào khác nhanh hơn nữa không?

Dĩ nhiên, so với việc liên tục báo động trong lòng, hành vi bên ngoài của Ultraman khá thoải mái.

Trong một cuộc phỏng vấn với CNBC, ông bày tỏ sự lạc quan thận trọng: "Tác động của Gemini 3 đến chỉ báo việc kinh doanh của chúng tôi có lẽ nhỏ hơn so với dự đoán." Ông dự đoán rằng OpenAI sẽ dỡ bỏ trạng thái "báo động đỏ" và "đưa tình trạng này lên địa vị rất mạnh" vào tháng 1 năm 2026.

02 Một giấc mơ kéo dài cả thập kỷ, hay một thập kỷ với mười giấc mơ?

OpenAI vừa kỷ niệm 10 năm thành lập, và trang web chính thức của công ty đã phát hành một video giới thiệu về nguồn gốc và định hướng tương lai của công ty.

Mười năm trước, khi Musk vẫn còn tích cực tham gia dự án OpenAI, Jensen Huang đã tặng OpenAI chiếc máy chủ DGX-1 đầu tiên trên thế giới. Nhiều nhân vật nổi tiếng đã ký tên lên đó, và bối cảnh có một khẩu hiệu : "Câu hỏi quan trọng không phải là chúng ta biết gì, mà là chúng ta sử dụng những gì mình biết như thế nào ... Tôi tin rằng mỗi người trong chúng ta đều có trách nhiệm hành động như thể vận mệnh của cả thế giới đang nằm trên vai mình."

Trong thập kỷ qua, OpenAI đã mang đến cho thế giới những sản phẩm đột phá như ChatGPT và Sora. Ultraman đã đi khắp thế giới để thuyết giảng và hợp tác với nhiều gã khổng lồ ở Thung lũng Silicon để cung cấp tỷ lệ băm tính toán. Tuy nhiên, theo thời gian, OpenAI đã từ vị thế dẫn đầu đáng kể ban đầu bị các đối thủ bắt kịp hoặc thậm chí vượt qua.

OpenAI hiện đang đứng trước ngã ba đường đầy bất trắc.

Trong giai đoạn đầu, OpenAI tuyên bố mục tiêu của họ là "thúc đẩy trí tuệ kỹ thuật số theo cách có lợi nhất cho toàn nhân loại, mà không bị giới hạn bởi nhu cầu tạo ra lợi nhuận tài chính."

Catherine Flick, một chuyên gia về đạo đức trí tuệ nhân tạo tại Đại học Staffordshire, cũng nhấn mạnh rằng nguyên tắc nền tảng này đã trải qua một sự thay đổi mạnh mẽ. Điều này là bởi vì đằng sau kiến ​​trúc phức tạp của OpenAI là một công ty vì lợi nhuận với các lợi ích đan xen phức tạp.

“Hiện nay chúng ta có một công ty vì lợi nhuận đã hoàn toàn trốn tránh mọi trách nhiệm đối với các lợi ích xã hội và về cơ bản đã chấp nhận chủ trương tăng trưởng bằng mọi giá,” Flick nói, giải thích rằng OpenAI đang đi đầu trong cuộc cách mạng trí tuệ nhân tạo tạo sinh, nơi “có thể kiếm được tiền.”

Trong bối cảnh báo đỏ, ưu tiên hàng đầu của OpenAI là cải thiện trải nghiệm sản phẩm, trong khi thương mại hóa bị xếp sau, bởi vì điều này liên quan đến sự sống còn và cũng liên quan đến lý tưởng cao cả hơn của Ultraman—siêu trí tuệ có thể đạt được trong 10 năm. Tuy nhiên, viễn cảnh mong đợi này không phải là sự đồng thuận tuyệt đối trong nội bộ OpenAI.

03 Mâu thuẫn giữa thương mại hóa và quản trị

Đằng sau cuộc chạy đua công nghệ là áp lực khổng lồ mà OpenAI phải đối mặt để thương mại hóa và tạo ra lợi nhuận.

Altman tuyên bố rằng mục tiêu của OpenAI là đạt thu nhập hàng tháng tương đương 20 tỷ đô la mỗi năm vào cuối năm 2025, nhưng ông thừa nhận rằng "vẫn còn một chặng đường dài" trước khi đạt được lợi nhuận tổng thể.

Điều đáng chú ý hơn nữa là cam kết của OpenAI về việc đầu tư tới 1,4 nghìn tỷ đô la vào cơ sở hạ tầng điện toán trong vài năm tới để hỗ trợ tham vọng về trí tuệ nhân tạo của mình.

Theo dữ liệu mới nhất từ ​​công ty nghiên cứu thị trường Sensor Tower, tổng số người dùng hoạt động hàng tháng của ChatGPT trên toàn thế giới đạt 810 triệu người vào tháng 11 năm 2025, với tốc độ tăng trưởng chỉ 6% từ tháng 8 đến tháng 11, thấp hơn nhiều so với tốc độ tăng trưởng hơn 40% trong cùng kỳ năm 2024. Hơn nữa, thị phần toàn cầu của nó cũng giảm từ 38% xuống 35% trong vòng bốn tháng.

Hiện tại, ChatGPT là nguồn thu chính của OpenAI. Trong số hơn 800 triệu người dùng hoạt động hàng tuần, khoảng 6% trả 20 đô la mỗi tháng cho các dịch vụ cao cấp.

OpenAI đang cố gắng khai thác nhiều giá trị hơn từ người dùng miễn phí, khám phá các hướng đi bao gồm việc giới thiệu quảng cáo trong ChatGPT và phát triển mô hình chia sẻ doanh thu (ví dụ: OpenAI nhận một phần khi người dùng mua sắm thông qua chatbot).

Simo cũng xác nhận rằng OpenAI có kế hoạch giới thiệu tính năng dự đoán độ tuổi người dùng để bảo vệ thanh thiếu niên trước khi ra mắt "chế độ người lớn" (có thể cho phép nội dung dành cho người lớn). "Chế độ người lớn" dự kiến ​​ra mắt quý đầu tiên của năm sau.

Đồng thời, OpenAI đang tích cực mở rộng sang thị trường phần mềm doanh nghiệp, định vị mình là một công ty phục vụ cả người tiêu dùng và doanh nghiệp. Những cải tiến về hiệu năng trong GPT-5.2 ở các lĩnh vực chuyên môn như lập trình, luật và tài chính chính là nhằm mục đích thu hút các khách hàng doanh nghiệp giá trị cao.

Tuy nhiên, trong thị trường này, OpenAI sẽ đối diện sự cạnh tranh khốc liệt trực tiếp từ những gã khổng lồ như Google và Microsoft, những công ty có khả năng tích hợp độ sâu các công cụ AI với hệ sinh thái phần mềm văn phòng đã phát triển (như Google Workspace và Microsoft 365).

Khả năng sinh lời có thể giúp OpenAI có được nguồn tài trợ liên tục để tiếp tục theo đuổi lý tưởng cao cả là giúp đỡ nhân loại, nhưng quá trình này cũng sẽ làm nảy sinh sê-ri các vấn đề về an ninh và đạo đức.

Ngay trước khi phát hành GPT-5.2, OpenAI phải đối mặt với một vụ kiện mới cáo buộc rằng sự tương tác của ChatGPT với một người dùng bị rối loạn tâm thần đã gián tiếp góp phần gây ra thảm kịch giết người tự sát ở Connecticut. Điều đáng chú ý là đây không phải là vụ kiện đầu tiên thuộc loại này.

OpenAI phản hồi rằng sự việc này "rất đau lòng" và cam kết sẽ liên tục cải thiện khả năng của hệ thống trong việc nhận diện và phản hồi các dấu hiệu rối loạn tâm lý, hướng dẫn người dùng tìm kiếm sự trợ giúp thực tế.

Hơn nữa, vụ kiện đang diễn khởi kiện tờ New York Times đệ trình chống lại OpenAI và đối tác Microsoft vì vi phạm bản quyền đã làm nổi bật thách thức cơ bản của ngành công nghiệp về tính hợp pháp của dữ liệu huấn luyện AI.

04. Cạnh tranh với Google để giành vị trí thống trị

Cuộc cạnh tranh giữa OpenAI và Google từ lâu đã vượt qua sự so sánh đơn thuần về các thông số kỹ thuật, phát triển thành một cuộc chiến toàn diện bao gồm sự cải tiến công nghệ, xây dựng hệ sinh thái, mô hình kinh doanh, quản trị an ninh và khả năng duy trì vốn.

Về mặt kỹ thuật, cuộc cạnh tranh giành vị trí dẫn đầu trong các bài kiểm tra hiệu năng ngày càng trở nên khốc liệt.

Mặc dù Phó chủ tịch nghiên cứu của OpenAI, Aidan Clark, không tiết lộ những đột phá cụ thể trong quá trình huấn luyện GPT-5.2, ông thừa nhận những cải tiến liên tục trong các khía cạnh cơ bản như huấn luyện trước, giải đáp những lo ngại trong ngành về việc liệu tiềm năng của huấn luyện trước đã được khai thác hết hay chưa.

Ở cấp độ hệ sinh thái, OpenAI đã ra mắt trình duyệt riêng của mình, nhằm cạnh tranh với Chrome của Google và nỗ lực xây dựng một hệ sinh thái khép kín hoàn chỉnh từ các mô hình nền tảng đến các ứng dụng cấp cao hơn. Mặt khác, Google đang cố gắng tạo ra lợi thế cộng hưởng thông qua việc tích hợp, tận dụng ma trận sản phẩm khổng lồ hiện có của mình.

Wei-Lin Chiang của LMARaena, một nền tảng đánh giá mô hình AI, chỉ ra: "Tăng trưởng người dùng đối với các mô hình tổng quát đã đạt đến điểm nghẽn, và động lực tăng trưởng tiếp theo chắc chắn sẽ đến từ các lĩnh vực chuyên ngành."

Ông cũng nhấn mạnh rằng cốt lõi của cuộc cạnh tranh hiện nay không còn đơn thuần là việc mở rộng người dùng, mà là ai có thể dẫn đầu trong việc thiết lập các giải pháp đáng tin cậy và hiệu quả trong các ngành trọng điểm như y tế và tài chính, và thực sự hiện thực hóa việc chuyển đổi năng lực công nghệ thành giá trị công nghiệp.

Cuối cùng, ở cấp độ chiến lược và văn hóa, sự chuyển đổi nhanh chóng của OpenAI từ một tổ chức nghiên cứu phi lợi nhuận thành một thực thể thương mại có giá trị cao, và việc theo đuổi lợi nhuận một cách cấp bách, đang định hình lại văn hóa nội bộ của nó. Một số điểm khác biệt mà các nhân viên đời đầu từng tự hào—sự khác biệt so với các mô hình dựa trên quảng cáo như của Google—đang dần bị lu mờ dưới áp lực của thực tế.

“Đây là một cuộc đua sẽ diễn ra trên nhiều mặt trận.” Phát biểu này của Rajan Krishnan, CEO của Vals AI, một công ty theo dõi hiệu suất của các công nghệ AI mới nhất, đã tóm tắt một cách chính xác sự phức tạp của cuộc chiến giành vị thế thống trị AI hiện nay.

Nhìn chung, việc phát hành GPT-5.2 là một tuyên bố công nghệ mạnh mẽ của OpenAI trong lĩnh vực chuyên môn của mình, nhưng nó vẫn chưa phải là kết thúc – họ đã không thể nới rộng khoảng cách với các đối thủ cạnh tranh, và ngay cả chính OpenAI cũng nói rằng chuông cảnh báo sẽ không tắt cho đến tháng 1 năm 2026. Quan trọng hơn, ngay cả khi "báo động đỏ" có thể tạm thời được dỡ bỏ trong ngắn hạn, thì mức độ cạnh tranh cao nhất trong toàn bộ ngành công nghiệp AI đã bắt đầu vang lên.

Bài viết này được đăng tải từ tài khoản WeChat chính thức "Tencent Technology" , tác giả: Su Yang Wuji, và được xuất bản với sự cho phép của 36Kr.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
75
Thêm vào Yêu thích
15
Bình luận