
Trong một video được phát hành vào cuối năm 2025, một số đối tác a16z , những người từ lâu đã đầu tư vào ngành công nghiệp, dịch vụ tài chính và phần mềm doanh nghiệp của Mỹ, đã chỉ ra rằng vào đầu năm 2025, OpenAI và Google đã đẩy nhanh việc triển khai AI dành cho người tiêu dùng gần như đồng thời. Từ mô hình đến thiết kế giao diện, mục tiêu của họ là giúp người dùng thông thường dễ dàng bắt đầu sử dụng. a16z cho rằng thị trường AI dành cho người tiêu dùng đã cho thấy cấu trúc ban đầu của "kẻ thắng cuộc chiếm tất cả" hoặc "một vài người dẫn đầu kiểm soát phần lớn việc sử dụng", nhưng khi nhu cầu đa dạng hóa, thị trường LLM đang trở nên phân khúc hơn, và các doanh nhân mới vẫn là động lực chính trong trải nghiệm ứng dụng và sản phẩm.
Cuộc chiến giành thị trường trí tuệ nhân tạo dành cho người tiêu dùng đã bắt đầu từ đầu năm.
Nhìn lại đầu năm 2025, OpenAI và Google đã đẩy mạnh đầu tư vào thị trường AI dành cho người tiêu dùng gần như cùng một lúc. Cho dù đó là ra mắt các mô hình mới, cập nhật tính năng hay thử nghiệm các giao diện người dùng hoàn toàn mới, hướng đi đều khá rõ ràng: làm cho AI trở nên dễ sử dụng đối với người dùng phổ thông không có bối cảnh chuyên môn.
a16z chỉ ra rằng lý do cuộc cạnh tranh này rất quan trọng là vì thị trường trợ lý LLM dành cho người tiêu dùng đã cho thấy những dấu hiệu ban đầu của kịch bản "kẻ thắng cuộc sẽ chiếm tất cả", hoặc ít nhất là kẻ thắng cuộc sẽ chiếm phần lớn người dùng. Bất cứ ai thành công trong việc thiết lập chỗ đứng trước tiên có thể sẽ được khuếch đại lợi thế theo thời gian.
Xét về mức độ sử dụng hiện tại, ChatGPT đang dẫn trước đáng kể.
Dựa trên dữ liệu sử dụng thực tế, hầu hết người tiêu dùng hiện chỉ chọn một sản phẩm AI chính. Các cuộc khảo sát cho thấy chỉ khoảng 9% người dùng đồng thời trả tiền cho hai hoặc nhiều trong đó ChatGPT, Gemini , Claude hoặc Cursor.
Xét về quy mô tổng thể, ChatGPT hiện có khoảng 800 đến 900 triệu người dùng hoạt động hàng tuần, vượt trội đáng kể so với các đối thủ cạnh tranh. Lượng người dùng Gemini chiếm khoảng 35% so với ChatGPT trên web và khoảng 40% trên thiết bị di động. Mặt khác, Claude, Grok và Perplexity chủ yếu nằm trong phạm vi sử dụng từ 8% đến 10%.
Lượng người sử dụng Gemini đang tăng vọt, và sự phân khúc thị trường ngày càng trở nên rõ rệt.
Tuy nhiên, a16z cũng chỉ ra rằng tình hình thị trường đã thay đổi đáng kể trong 3 đến 6 tháng qua. Với sự phổ biến nhanh chóng của nhiều mô hình hình ảnh và video khác nhau, lượng người dùng Gemini trên máy tính để bàn đã tăng 155% so với cùng kỳ năm ngoái, trong khi tốc độ tăng trưởng hàng năm của ChatGPT chỉ khoảng 23%.
Đồng thời, thị trường đang bắt đầu cho thấy một xu hướng phân khúc rõ rệt. Ví dụ, Claude của Anthropic đang dần thiết lập vị thế riêng biệt trong nhóm người dùng chuyên nghiệp hoặc có trình độ kỹ thuật cao, không còn cạnh tranh trực tiếp với ChatGPT và Gemini trên thị trường đại chúng nữa.
Điểm nhấn lớn nhất của năm 2025 sẽ tập trung vào việc tạo ra hình ảnh và video.
Xét về mặt mô hình, những công nghệ lan truyền mạnh mẽ nhất năm 2025 sẽ không còn là các mô hình văn bản nữa, mà là các mô hình tạo hình ảnh và video. Các sáng kiến của OpenAI bao gồm trào lưu "kiểu Ghibli" do GPT-4 Images khởi xướng, cùng với Sora và Sora 2. Mặt khác, Google đã cho ra mắt VO, V3, V3.1, và sau đó là Nano Banana và Nano Banana Pro, những sản phẩm sau này cực kỳ phổ biến.
a16z mô tả tầm ảnh hưởng của Nano Banana tương đương, hoặc thậm chí vượt trội, so với những khoảnh khắc mang tính biểu tượng của Studio Ghibli. Trong khi đó, trọng tâm công nghệ của các mô hình hình ảnh đã dần chuyển từ tính thẩm mỹ và phong cách sang tính hiện thực và khả năng suy luận, cho phép chúng đồng thời hiểu nhiều hình ảnh và văn bản, xử lý động lực bối cảnh và tính khả thi vật lý, thậm chí tạo ra các đồ họa thông tin phức tạp và bản đồ thị trường.

Hướng tới năm 2026, trí tuệ nhân tạo (AI) đang hướng tới sự tích hợp đa phương thức.
Về chiến lược sản phẩm, OpenAI và Google đã đi theo những con đường khác nhau. OpenAI tích hợp hầu hết các chức năng của mình trực tiếp vào ChatGPT, chỉ phát hành Sora dưới dạng ứng dụng video độc lập. Mặt khác, Google phân phối sản phẩm của mình thông qua Gemini, Google AI Studio, Google Labs và nhiều trang web độc lập khác, tạo giao diện riêng cho từng sản phẩm. a16z chỉ ra rằng sự khác biệt này ảnh hưởng trực tiếp đến việc người dùng thông thường có biết bắt đầu từ đâu khi mở sản phẩm hay không.
Về các tính năng xã hội, tính năng trò chuyện nhóm và màn hình video Sora của OpenAI nhìn chung nhận được phản hồi khá thận trọng. a16z cho rằng rằng chức năng cốt lõi của ChatGPT vẫn là một công cụ tăng năng suất, khiến nó khó đáp ứng được động lực "được nhìn thấy và được công nhận" của các nền tảng xã hội.
Nhìn về năm 2026, a16z nhìn chung cho rằng AI sẽ tiếp tục hướng tới sự tích hợp đa phương thức với "bất kỳ hình thức đầu vào nào, bất kỳ hình thức đầu ra nào", trong khi các nhà cung cấp mô hình ngôn ngữ lớn có thể sẽ tiếp tục tập trung vào việc tối ưu hóa trải nghiệm cốt lõi. Trong khi đó, việc phát triển các ứng dụng AI dành cho người tiêu dùng với các đặc điểm sản phẩm mạnh mẽ vẫn sẽ do các công ty khởi nghiệp mới thống trị.
Bài viết này, a16z, nhìn về năm 2026: Các công ty khởi nghiệp sẽ vẫn là động lực chính của trí tuệ nhân tạo dành cho người tiêu dùng, và mô hình quản lý địa phương (LLM) đang dần hình thành . Bài viết này lần đầu tiên xuất hiện trên ABMedia ABMedia .





