Ark Investment: Google Nano Banana Pro khá tuyệt vời, nhưng tỷ lệ áp dụng vẫn thấp hơn ChatGPT.

avatar
ABMedia
11-28
Bài viết này được dịch máy
Xem bản gốc

Một cuộc thảo luận gần đây tại ARK Invest chỉ ra rằng mặc dù Gemini 3 của Google đã trở lại vị trí hàng đầu, nhưng bước đột phá của bản cập nhật này không nằm ở khả năng ngôn ngữ, mà nằm ở mô hình tạo hình ảnh và thông tin mới, "Nano Banana Pro". Đội ngũ ARK cho rằng rằng bản cập nhật này cho thấy công nghệ AI của Google đã trở lại vị trí hàng đầu, nhưng vẫn phải đối mặt với những thách thức trong chiến lược thương mại hóa và áp dụng của người dùng.

Đáp lại Gemini , Google nhấn mạnh rằng quy luật mở rộng AI vẫn chưa thất bại.

Fangzhou chỉ ra rằng Gemini 3 mới ra mắt của Google được xếp hạng cao trong nhiều bài kiểm tra chuẩn, do đó bác bỏ những nghi ngờ bên ngoài về "lợi nhuận giảm dần đối với các mô hình lớn". Đội ngũ kỹ thuật của Google tuyên bố rằng việc mở rộng quy mô vẫn mang lại những lợi ích rõ ràng, cho thấy khối lượng đào tạo có thể tăng lên đáng kể.

Về mặt kinh nghiệm thực tế, Downing, Giám đốc Nghiên cứu tại Ark AI, cho biết Gemini 3 ngang bằng với ChatGPT (Tư duy 5.1) trong việc xử lý hầu hết nhiệm vụ, mỗi tác vụ đều có những ưu điểm riêng. Ông cho rằng rằng việc Google lần hợp các tính năng bộ nhớ và cá nhân hóa vào Gemini là chìa khóa cho lần cải thiện đáng kể về độ hoàn thiện sản phẩm.

Nano Banana Pro thực sự là bước đột phá.

So với các mô hình ngôn ngữ, Ark cho rằng hiệu suất của Nano Banana Pro mang Sự lật đổ hơn. Mô hình này có thể cô đọng lượng lớn văn bản thành thông tin có cấu trúc như hình ảnh, bài thuyết trình và sơ đồ, và thậm chí có thể xuất chính xác các chuyển đổi văn bản sang hình ảnh, một rào cản mà hầu hết các mô hình trước đây đã phải vật lộn để vượt qua.

ARK chỉ ra rằng khả năng này rất có giá trị đối với việc tạo nội dung, tài liệu tiếp thị và công việc thông tin trực quan, chứng minh sự dẫn đầu rõ ràng của Google trong việc tạo hình ảnh và hiểu biết trực quan.

Google có lợi thế đi đầu trong việc tích hợp ngôn ngữ và hình ảnh vào kiến ​​trúc AI của mình.

Winton, nhà tương lai học hàng đầu tại Ark, cho rằng rằng kiến ​​trúc AI trong tương lai sẽ tích hợp khả năng suy luận ngôn ngữ, tạo hình ảnh và hệ thống trí nhớ dài hạn, và Google đã có những động thái trong cả ba công nghệ này, bao gồm cả kiến ​​trúc bộ nhớ Titans đã phát hành trước đó.

Lần 3 và Nano Banana Gemini được xem là những thành phần quan trọng của kiến ​​trúc AI thế hệ tiếp theo của Google.

Google và OpenAI xung đột trực diện, công nghệ bộ nhớ trở thành chiến trường mới.

Fangzhou chỉ ra rằng bộ nhớ trò chuyện chéo đang trở thành yếu tố then chốt trong việc giữ chân người dùng nền tảng. Tính năng bộ nhớ trò chuyện chéo của ChatGPT, sau khi ra mắt, có thể ghi nhớ sở thích và bối cảnh của người dùng, cải thiện đáng kể mức độ tương tác của người dùng.

Việc Google lần áp dụng thiết kế tương tự cho Gemini cho thấy cả hai công ty đều coi bộ nhớ là trọng tâm cạnh tranh tiếp theo. Tuy nhiên, Fangzhou cho rằng rằng việc quên đi những cuộc trò chuyện dài và sự bất tiện khi chuyển đổi nội dung lịch sử vẫn là những thách thức mà toàn ngành cần cùng nhau vượt qua.

TPU so với GB200: Cả hai mẫu đều chọn NVIDIA là người chiến thắng.

Điều đáng chú ý là khi Ark hỏi Gemini 3 và ChatGPT về "sự khác biệt về hiệu suất/tiêu thụ điện năng giữa Google TPU v7 và NVIDIA GB200", cả hai đều đưa ra cùng một kết luận: NVIDIA vẫn chiếm ưu thế về hiệu suất/tiêu thụ điện năng.

Fangzhou chỉ ra rằng trong khi Google có lợi thế về chi phí đầu tư nhờ TPU do chính mình phát triển, thì việc đào tạo và suy luận AI đang nhanh chóng bị hạn chế bởi "điện". Khi điện trở thành một nút thắt mới đối với AI tạo sinh, tỷ lệ hiệu suất/tiêu thụ điện năng sẽ trực tiếp quyết định số lượng mã thông báo mà một mô hình có thể tạo ra trên mỗi watt điện, đồng thời cũng sẽ ảnh hưởng đến hiệu quả hoạt động chung và mức doanh thu tối đa.

(Sự khác biệt về công nghệ và xu hướng thị trường tương lai của GPU NVIDIA, Google TPU và chip AI tự phát triển của Amazon AWS)

Nếu YouTube Premium được tích hợp với Gemini, Google có thể sẽ phải viết lại trò chơi.

Fangzhou tin rằng nếu Google biến YouTube Premium và Gemini Pro thành một gói đăng ký duy nhất (với mức giá 19,99 đô la mỗi tháng), điều này sẽ gây áp lực đáng kể lên thị trường.

Các công ty AI như OpenAI dựa vào thu nhập đăng ký và không thể chịu được cuộc chiến giá cả, trong khi Google có nhiều nguồn thu nhập đa dạng như tìm kiếm, quảng cáo và dịch vụ đám mây, và có thể tận dụng hệ sinh thái nội dung của mình để mở rộng đáng kể khả năng cạnh tranh về phía người tiêu dùng.

Điểm yếu lớn nhất của Google nằm ở mức độ chấp nhận của người dùng; tỷ lệ chấp nhận thấp hơn ChatGPT.

Mặc dù ghi nhận những tiến bộ công nghệ lần Google, Fangzhou cũng thừa nhận điểm yếu lớn nhất của mình vẫn nằm ở phía người dùng. Fangzhou trích dẫn dữ liệu sử dụng ứng dụng tại Mỹ, chỉ ra rằng ChatGPT dẫn đầu với 99%, trong khi Gemini chỉ đạt 1%.

Ngay cả trên phạm vi toàn cầu, mức độ sử dụng của Gemini vẫn tụt hậu đáng kể, không chỉ không bắt kịp ChatGPT mà còn vượt trội hơn đáng kể so với Grok của xAI về số phút sử dụng. Fangzhou chỉ ra rằng điều này chứng minh rằng sự cạnh tranh giữa các nền tảng AI không chỉ nằm ở khả năng của mô hình; khả năng tiếp cận sản phẩm, nỗ lực tiếp thị và thói quen người dùng mới là những biến số chính quyết định tỷ lệ áp dụng lâu dài.

(Kiểm tra thực tế: Gemini 3 Nano Banana Pro tự động tạo truyện tranh hài hước sau khi suy nghĩ, khiến Trump trông giống như một chàng trai trẻ điển trai một lần nữa)

Bài viết này, "Đầu tư Ark: Google Nano Banana Pro khá tuyệt vời, nhưng tỷ lệ áp dụng vẫn thấp hơn ChatGPT", lần đầu tiên xuất hiện trên ABMedia .

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận