hiểu biết mới của đối tác a16z về tiêu dùng - AI tái thiết đường đi tiêu dùng, AI + điểm đột phá xã hội khi không có hệ thống bảo vệ

06-16

Bài viết này được dịch máy

Xem bản gốc

Tác giả: Newin

Tiêu đề gốc: Thông tin chi tiết mới nhất về người tiêu dùng của đối tác a16z - AI đang định hình lại mô hình người tiêu dùng và hệ thống bảo vệ ngoại trừ tốc độ, và AI + xã hội thực sự vẫn chưa xuất hiện

Từ Facebook đến TikTok, các sản phẩm tiêu dùng đã thúc đẩy sự tiến hóa xã hội bằng cách kết nối mọi người. Nhưng trong chu kỳ mới do AI thúc đẩy, "hoàn thành nhiệm vụ" đang thay thế "xây dựng mối quan hệ" trở thành dòng sản phẩm chính. Các sản phẩm như ChatGPT, Runway và Midjourney đại diện cho các điểm vào mới không chỉ định hình lại cách tạo nội dung mà còn thay đổi cấu trúc thanh toán của người dùng và đường dẫn kiếm tiền từ sản phẩm.

Năm đối tác a16z tập trung vào đầu tư của người tiêu dùng đã tiết lộ trong một cuộc thảo luận rằng, mặc dù các công cụ AI hiện tại rất mạnh mẽ, nhưng chúng vẫn chưa thiết lập được cấu trúc xã hội và thiếu điểm tựa nền tảng là "kết nối".

Sự vắng mặt của các sản phẩm tiêu dùng phổ biến phản ánh khoảng cách giữa nền tảng và mô hình. Một hệ thống xã hội thực sự dựa trên AI vẫn chưa xuất hiện và khoảng cách này có thể tạo ra thế hệ siêu ứng dụng tiếp theo. Quá khứ và hiện tại của chiến lược nền tảng a16z : từ VC "không muốn dọn dẹp mớ hỗn độn" đến "dịch vụ toàn diện"

Đồng thời, các avatar AI, tác nhân giọng nói và tính cách kỹ thuật số đã hình thành và ý nghĩa của chúng vượt xa tình bạn hoặc công cụ, mà còn xây dựng các cơ chế biểu đạt và mối quan hệ tâm lý mới. Trong tương lai, khả năng cạnh tranh cốt lõi của nền tảng có thể chuyển sang khả năng mô hình, tốc độ phát triển sản phẩm và mức độ tích hợp hệ thống nhận thức.

▍AI đang viết lại mô hình kinh doanh 2C

Trong hai thập kỷ qua, cứ vài năm lại xuất hiện những sản phẩm tiêu biểu trong lĩnh vực tiêu dùng, từ Facebook, Twitter đến Instagram, Snapchat, WhatsApp, Tinder và TikTok. Mỗi sản phẩm đều thúc đẩy sự phát triển của mô hình xã hội. Trong những năm gần đây, nhịp điệu này dường như đã trì trệ, đặt ra một câu hỏi quan trọng: Liệu sự đổi mới có thực sự bị dừng lại hay định nghĩa của chúng ta về "sản phẩm tiêu dùng" đang phải đối mặt với sự tái thiết?

Trong chu kỳ mới, ChatGPT được cho rằng một trong những sản phẩm tiêu dùng tiêu biểu nhất. Mặc dù không phải là mạng xã hội theo nghĩa truyền thống, nhưng nó đã thay đổi sâu sắc mối quan hệ của mọi người với thông tin, nội dung và thậm chí là các công cụ. Các công cụ như Midjourney, ElevenLabs, Blockade Labs, Kling, VEO, v.v. đã nhanh chóng trở nên phổ biến trong lĩnh vực âm thanh, video và hình ảnh, nhưng hầu hết trong đó vẫn chưa thiết lập được cấu trúc kết nối giữa mọi người và không có thuộc tính biểu đồ xã hội.

Hiện nay, hầu hết các cải tiến AI vẫn do các nhà nghiên cứu mô hình dẫn đầu, những người có chuyên môn độ sâu nhưng thiếu kinh nghiệm trong việc xây dựng các sản phẩm cuối. Với sự phổ biến của API và các cơ chế mã nguồn mở, các khả năng cơ bản đang được phát hành và các bản hit mới dành cho người tiêu dùng cũng có thể ra đời.

Sự phát triển của Internet tiêu dùng trong 20 năm qua, sự thành công của Google, Facebook và Uber, bắt nguồn từ ba làn sóng cơ bản của Internet, thiết bị di động và điện toán đám mây. Sự phát triển hiện tại đến từ bước nhảy vọt về khả năng của mô hình. Nhịp điệu công nghệ không còn thể hiện ở các bản cập nhật chức năng nữa mà được thúc đẩy bởi các mô hình nâng cấp từ xa.

Dòng sản phẩm tiêu dùng chính cũng đã chuyển từ "kết nối mọi người" sang "hoàn thành nhiệm vụ". Google từng là công cụ để thu thập thông tin và ChatGPT đang dần thay thế nhân vật của nó. Mặc dù các sản phẩm dạng công cụ như Dropbox và Box chưa thiết lập được biểu đồ xã hội, nhưng chúng vẫn có sự thâm nhập rộng rãi vào phía người tiêu dùng. Mặc dù nhu cầu tạo nội dung tiếp tục tăng, nhưng cấu trúc kết nối của kỷ nguyên AI vẫn chưa được thiết lập. Khoảng cách này có thể là hướng đi của vòng đột phá tiếp theo.

Hệ thống bảo vệ của các nền tảng xã hội truyền thống đang phải đối mặt với việc đánh giá lại. Với bối cảnh trỗi dậy của AI, sự thống trị của nền tảng có thể đang chuyển từ việc xây dựng bản đồ mối quan hệ sang xây dựng các mô hình và hệ thống nhiệm vụ. Liệu các công ty công nghệ như OpenAI có trở thành thế hệ công ty nền tảng tiếp theo hay không là điều đáng chú ý. Lợi nhuận chỉ có thể dựa vào OpenAI? Người sáng lập quỹ đô la Thung lũng Silicon trong 20 năm cảnh báo rằng mô hình VC đang trên bờ vực thất bại

Theo quan điểm của mô hình kinh doanh, khả năng kiếm tiền của các sản phẩm AI vượt xa các công cụ tiêu dùng trước đây. Trước đây, ngay cả đối với các ứng dụng hàng đầu, thu nhập trung bình của người dùng vẫn tương đối thấp. Ngày nay, những người dùng hàng đầu có thể trả tới 200 đô la mỗi tháng, vượt quá giới hạn trên của hầu hết các nền tảng công nghệ truyền thống. Điều này có nghĩa là các công ty có thể bỏ qua quảng cáo và con đường kiếm tiền dài và có được thu nhập ổn định trực tiếp thông qua đăng ký. Việc quá chú trọng vào hiệu ứng mạng lưới và hệ thống bảo vệ ban đầu về cơ bản là do khả năng kiếm tiền yếu của các sản phẩm. Ngày nay, miễn là các công cụ đủ giá trị, người dùng tự nhiên sẵn sàng trả tiền.

Sự thay đổi này đã mang đến một bước ngoặt về mặt cấu trúc. "Mô hình kinh doanh yếu" truyền thống buộc những người sáng lập phải xây dựng các câu chuyện xung quanh chỉ báo như mức độ trung thành của người dùng và giá trị vòng đời, trong khi các sản phẩm AI có thể khép lại vòng lặp logic kinh doanh trong giai đoạn đầu ra mắt nhờ khả năng tính phí trực tiếp.

Mặc dù các mô hình như Claude, ChatGPT và Gemini có vẻ tương tự nhau về mặt chức năng, nhưng có những khác biệt đáng kể trong trải nghiệm người dùng thực tế. Sự khác biệt về sở thích này đã tạo ra các nhóm người dùng độc lập. Thay vì một cuộc chiến giá cả, thị trường đã cho thấy xu hướng tăng giá liên tục đối với các sản phẩm hàng đầu, cho thấy một cấu trúc cạnh tranh khác biệt đã dần được thiết lập.

AI cũng đang định hình lại định nghĩa về "tỷ lệ duy trì". Trong các sản phẩm đăng ký truyền thống, tỷ lệ duy trì người dùng quyết định tỷ lệ duy trì thu nhập. Ngày nay, người dùng có thể tiếp tục sử dụng các dịch vụ cơ bản, nhưng chọn nâng cấp đăng ký của họ do các cuộc gọi thường xuyên hơn, điểm lớn hơn hoặc các mô hình chất lượng cao hơn. Tỷ lệ duy trì thu nhập cao hơn đáng kể so với tỷ lệ duy trì người dùng, điều này là chưa từng có.

Mô hình định giá của các sản phẩm AI đang trải qua một sự thay đổi cơ bản. Chi phí đăng ký cho người tiêu dùng truyền thống là khoảng 50 đô la một năm, nhưng hiện nay lượng lớn người dùng sẵn sàng trả 200 đô la một tháng hoặc thậm chí nhiều hơn. Tính chấp nhận được của cấu trúc giá này bắt nguồn từ sự thay đổi cơ bản về giá trị thực tế mà người dùng trải nghiệm.

Lý do tại sao các sản phẩm AI có thể được chấp nhận với mức phí bảo hiểm cao là vì chúng không còn chỉ là "hỗ trợ cải tiến" mà thực sự là "hoàn thành nhiệm vụ cho người dùng". Lấy các công cụ nghiên cứu làm ví dụ. Báo cáo ban đầu mất mười giờ để biên soạn thủ công giờ đây có thể được tạo trong vài phút. Ngay cả khi dịch vụ chỉ được sử dụng lần trong năm, thì nó vẫn có kỳ vọng thanh toán hợp lý.

Trong lĩnh vực tạo video, mô hình Gen-3 của Runway được cho rằng là đại diện cho sự tiến hóa trải nghiệm về thế hệ công cụ AI tiếp theo. Video có nhiều phong cách khác nhau có thể được tạo thông qua lời nhắc ngôn ngữ tự nhiên, hỗ trợ tùy chỉnh giọng nói và hành động. Một số người dùng sử dụng công cụ này tạo ra video độc quyền với tên bạn bè và một số nhà sáng tạo tạo ra các tác phẩm hoạt hình hoàn chỉnh và tải chúng lên các nền tảng xã hội. Trải nghiệm tương tác "tạo trong vài giây và sử dụng ngay lập tức" này là chưa từng có.

Theo góc độ cấu trúc tiêu dùng, chi tiêu chính của người dùng trong tương lai sẽ tập trung cao độ vào ba hạng mục: thực phẩm, tiền thuê nhà và phần mềm. Là một công cụ chung, phần mềm đang thâm nhập nhanh hơn và chiếm tỷ lệ chi tiêu của nó tiếp tục tăng, điều này đã bắt đầu ăn mòn không gian ngân sách ban đầu thuộc về các hạng mục khác.

▍Mạng xã hội AI thực sự vẫn chưa xuất hiện

Giải trí, sáng tạo và thậm chí cả các mối quan hệ giữa các cá nhân đang dần được trung gian hóa bằng các công cụ AI. Nhiều thứ từng dựa vào giao tiếp ngoại tuyến hoặc tương tác xã hội giờ đây có thể đạt được thông qua các mô hình đăng ký, từ tạo video đến hỗ trợ viết và thậm chí thay thế một số biểu hiện cảm xúc.

Theo xu hướng này, cơ chế kết nối giữa con người cũng đang phải đối mặt với nhu cầu phải suy nghĩ lại. Mặc dù người dùng vẫn hoạt động trên các nền tảng truyền thống như Instagram và Twitter, nhưng một thế hệ phương pháp kết nối mới theo đúng nghĩa vẫn chưa xuất hiện.

Bản chất của các sản phẩm xã hội luôn xoay quanh "cập nhật trạng thái". Từ văn bản đến hình ảnh, rồi đến video ngắn, phương tiện truyền thông tiếp tục phát triển, nhưng logic cơ bản luôn là "tôi đang làm gì" - mục đích là thiết lập cảm giác hiện diện và nhận phản hồi. Cấu trúc này hình thành nền tảng cho thế hệ nền tảng xã hội trước đó.

Câu hỏi hiện nay là, AI có thể tạo ra một cách kết nối mới không? Tương tác mô hình đã thâm nhập vào cuộc sống của người dùng. Trong lượng lớn các cuộc trò chuyện với các công cụ AI mỗi ngày, tâm lý và nhu cầu cực kỳ cá nhân được đưa vào. Đầu vào dài hạn này rất có thể hiểu người dùng tốt hơn các công cụ tìm kiếm. Nếu nó được rút một cách có hệ thống và đưa ra bên ngoài như một "bản thân kỹ thuật số", logic kết nối giữa mọi người có thể được tái tạo.

Một số hiện tượng ban đầu đã bắt đầu xuất hiện. Ví dụ, trên TikTok, các bài kiểm tra tính cách, sáng tác truyện tranh và bắt chước nội dung dựa trên phản hồi của AI đã bắt đầu xuất hiện. Những hành vi này không chỉ là sáng tác nội dung mà còn là biểu hiện xã hội của "bản đồ kỹ thuật số". Người dùng không chỉ sáng tác mà còn tích cực chia sẻ, kích hoạt sự bắt chước và tương tác, thể hiện sự quan tâm cao độ đến "biểu đạt bản thân kỹ thuật số".

Nhưng tất cả những điều này vẫn bị giới hạn trong cấu trúc nền tảng cũ. Cho dù là TikTok hay Facebook, mặc dù nội dung thông minh hơn, cấu trúc luồng thông tin và logic tương tác hầu như không thay đổi. Nền tảng không thực sự phát triển do sự bùng nổ của mô hình, mà chỉ trở thành một container lưu trữ nội dung được tạo ra.

Bước nhảy vọt về khả năng tạo ra vẫn chưa tìm được một mô hình nền tảng phù hợp. Lượng lớn nội dung thiếu sự trình bày có cấu trúc và tổ chức tương tác, thay vào đó bị hòa tan thành nhiễu thông tin bởi kiến trúc nội dung hiện có của nền tảng. Nền tảng cũ chịu trách nhiệm về chức năng mang nội dung, thay vì là công cụ tái thiết của mô hình xã hội.

Nền tảng hiện tại giống như một "hệ thống cũ với lớp da mới". Mặc dù video ngắn, Reels và các hình thức khác có giao diện hiện đại và tông màu trẻ trung, nhưng logic đằng sau chúng vẫn bị ràng buộc bởi mô hình đẩy luồng thông tin và phân phối.

Một câu hỏi cốt lõi chưa có lời giải đáp là: Sản phẩm xã hội “gốc AI” đầu tiên thực sự sẽ trông như thế nào?

Đây không phải là một bản ghép hình ảnh do mô hình tạo ra hoặc một bản làm mới trực quan của luồng thông tin, mà là một hệ thống có thể mang theo những biến động tâm lý thực sự, các kết nối kích hoạt và sự cộng hưởng. Bản chất của tương tác xã hội không bao giờ là một màn trình diễn hoàn hảo, mà sự không chắc chắn - bối rối, thất bại và sự hài hước tạo nên cấu trúc căng thẳng của cảm xúc. Ngày nay, lượng lớn các công cụ AI tạo ra "phiên bản người dùng lý tưởng", luôn tích cực và mượt mà, nhưng làm cho trải nghiệm xã hội thực sự trở nên đơn điệu và trống rỗng.

Các sản phẩm hiện được gọi là "AI social" về cơ bản vẫn là bản sao mô phỏng của logic cũ. Một thông lệ phổ biến là tái sử dụng cấu trúc giao diện của nền tảng cũ và sử dụng mô hình làm nguồn nội dung, nhưng điều này không mang lại những thay đổi cơ bản trong mô hình sản phẩm và cấu trúc tương tác. Các sản phẩm thực sự mang tính đột phá phải tái cấu trúc hệ thống nền tảng từ logic cơ bản của "AI + con người".

Những hạn chế về mặt kỹ thuật vẫn là một trở ngại lớn. Hầu như tất cả các sản phẩm tiêu dùng phổ biến đều được sinh ra trên thiết bị di động, nhưng việc triển khai các mô hình lớn hiện nay trên điện thoại di động vẫn phải đối mặt với những thách thức. Các khả năng như phản hồi theo thời gian thực và tạo đa phương thức đặt ra những yêu cầu cực kỳ cao về tỷ lệ băm ở phía đầu cuối. Trước những đột phá trong nén mô hình và hiệu quả tính toán, các sản phẩm xã hội "AI gốc" vẫn sẽ khó có thể triển khai đầy đủ.

Cơ chế ghép đôi cá nhân là một hướng khác chưa được kích hoạt đầy đủ. Mặc dù các nền tảng xã hội có lượng lớn dữ liệu người dùng lớn, nhưng chúng vẫn thiếu sự thúc đẩy có hệ thống trong liên kết "chủ động đề xuất các kết nối phù hợp". Trong tương lai, nếu có thể xây dựng một hệ thống ghép đôi động dựa trên hành vi, ý định và chế độ tương tác ngôn ngữ của người dùng, logic cơ bản của mạng xã hội sẽ được định hình lại.

AI không chỉ có thể nắm bắt "bạn là ai", mà còn có thể mô tả "những gì bạn biết", "cách bạn suy nghĩ" và "những gì bạn có thể mang lại". Khả năng này không còn giới hạn ở "hồ sơ nhận dạng" dựa trên nhãn tĩnh, mà hình thành "mô hình tính cách" động và giàu ngữ nghĩa. Các nền tảng truyền thống như LinkedIn xây dựng các chỉ mục tự động tĩnh, trong khi AI có khả năng tạo ra giao diện tính cách sống động dựa trên kiến thức.

Trong tương lai, con người thậm chí có thể giao tiếp trực tiếp với một "bản ngã tổng hợp" và có được kinh nghiệm, phán đoán và giá trị từ tính cách kỹ thuật số. Đây không còn là sự tối ưu hóa cấu trúc luồng thông tin nữa mà là sự tái thiết cơ bản của cơ chế biểu hiện tính cách và bản thân kết nối xã hội.

▍Thời đại AI không có hệ thống bảo vệ, chỉ có tốc độ

Ngoài thực tế là mạng xã hội vẫn chưa mở ra một sự thay đổi mô hình, con đường lan truyền người dùng của các công cụ AI cũng đang đảo ngược. Khác với logic Internet trước đây là cất cánh từ đầu C và dần dần thâm nhập vào đầu B, các công cụ AI hiện trình bày một mô hình lan truyền ngược trong nhiều tình huống, với đầu doanh nghiệp dẫn đầu và đầu người tiêu dùng lan truyền sau.

Lấy các công cụ tạo giọng nói làm ví dụ, những người dùng ban đầu chủ yếu tập trung vào các nhóm thích hợp như geeks, người sáng tạo và nhà phát triển trò chơi, và các mục đích sử dụng bao gồm sao chép giọng nói, lồng tiếng video và mô-đun trò chơi. Tuy nhiên, động lực thực sự thúc đẩy tăng trưởng đến từ việc áp dụng có hệ thống và quy mô lớn của khách hàng doanh nghiệp, được áp dụng cho tạo ra giải trí, nội dung phương tiện, tổng hợp giọng nói và các lĩnh vực khác. Nhiều công ty đã nhúng công cụ này vào quy trình làm việc của họ và hoàn thành việc thâm nhập doanh nghiệp sớm hơn dự kiến.

Con đường này không phải là trường hợp cá biệt. Nhiều sản phẩm AI đã cho thấy một quỹ đạo tương tự: ban đầu thu hút sự chú ý thông qua truyền thông lan truyền ở phía C, sau đó khách hàng phía B trở thành động lực chính của việc kiếm tiền và mở rộng quy mô. Không giống như các sản phẩm tiêu dùng truyền thống khó chuyển đổi thành phía doanh nghiệp, nhiều công ty hiện đang xác định các công cụ AI thông qua cộng đồng như Reddit, X và Newsletter và tích cực thử nghiệm chúng. Sự nhiệt tình của người tiêu dùng đã trở thành một cổng thông tin để các công ty triển khai AI.

Logic này đang được sản xuất và thiết kế thành một chiến lược hệ thống. Một số công ty đã thiết lập các cơ chế. Khi nền tảng phát hiện nhiều nhân viên trong cùng một tổ chức đã đăng ký và sử dụng một công cụ, nó sẽ chủ động kích hoạt quy trình bán hàng B-side thông qua dữ liệu thanh toán hoặc quyền sở hữu tên miền. Việc di chuyển tiêu dùng sang doanh nghiệp không còn là một sự kiện riêng lẻ nữa mà là một tập hợp các con đường kinh doanh có thể sao chép được.

Cơ chế khuếch tán "từ dưới lên" này cũng đặt ra một câu hỏi lớn hơn: Liệu những sản phẩm AI phổ biến này có phải là nền tảng nền tảng của tương lai hay chúng chỉ là những sản phẩm chuyển tiếp như MySpace và Friendster?

Phán đoán hiện tại có xu hướng thận trọng lạc quan. Các công cụ AI có tiềm năng phát triển thành nền tảng dài hạn, nhưng chúng phải vượt qua áp lực kỹ thuật do sự tiến hóa liên tục của lớp mô hình mang lại. Lấy thế hệ mô hình đa phương thức mới làm ví dụ, nó không chỉ hỗ trợ nhân vật, cộng tác đồ họa và tạo âm thanh thời gian thực mà độ sâu của biểu đạt và phương pháp tương tác cũng đang được cải thiện nhanh chóng. Ngay cả trong một đường dẫn tương đối ổn định như trường văn bản, vẫn còn rất nhiều chỗ cho việc tối ưu hóa mô hình. Miễn là nó có thể được lặp lại liên tục, cho dù là tự phát triển hay tích hợp hiệu quả, thì các sản phẩm công cụ có khả năng vẫn đi đầu và sẽ không bị thay thế nhanh chóng.

"Đừng tụt hậu" đã trở thành đề xuất cạnh tranh thực tế nhất hiện nay. Trong một thị trường ngày càng phân khúc, việc tạo hình ảnh không còn là tiêu chí duy nhất của "ai là người giỏi nhất" nữa mà là cuộc cạnh tranh định vị chính xác của "ai phù hợp nhất với họa sĩ minh họa, nhiếp ảnh gia và người dùng phổ thông". Miễn là sản phẩm liên tục được cập nhật và người dùng vẫn hiện diện, thì sản phẩm có thể đạt được tính bền vững lâu dài.

Sự phân biệt chuyên môn tương tự cũng xuất hiện trong các công cụ video. Các sản phẩm khác nhau tốt ở các dạng nội dung khác nhau, một số tập trung vào quảng cáo thương mại điện tử, một số nhấn mạnh vào nhịp điệu tường thuật và một số tập trung vào chỉnh sửa cấu trúc. Dung lượng thị trường đủ lớn để hỗ trợ sự cùng tồn tại của nhiều định vị. Chìa khóa nằm ở sự rõ ràng và ổn định của định vị cấu trúc.

Cuộc thảo luận về việc liệu khái niệm "hệ thống bảo vệ" có còn áp dụng được trong kỷ nguyên AI hay không đang trải qua một sự thay đổi cơ bản. Logic truyền thống nhấn mạnh vào hiệu ứng mạng, ràng buộc nền tảng và tích hợp quy trình, nhưng nhiều dự án được cho rằng là có "hệ thống bảo vệ sâu" trong những ngày đầu cuối cùng đã không trở thành người chiến thắng. Thay vào đó, đội ngũ nhỏ thường xuyên thử và thất bại và cập nhật nhanh chóng trong các kịch bản biên tiếp tục lặp lại trên các mô hình và sản phẩm và cuối cùng đã vào trung tâm của đường đua chính.

"Hệ thống bảo vệ" đáng chú ý nhất hiện nay là tốc độ: một là tốc độ phân phối, tức là ai có thể bước vào tầm nhìn của người dùng trước; hai là tốc độ lặp lại, tức là ai có thể ra mắt các chức năng mới và kích thích quán tính sử dụng nhanh nhất. Trong thời đại sự chú ý khan hiếm và nhận thức bị phân mảnh cao, bất kỳ ai xuất hiện trước và bất kỳ ai tiếp tục thay đổi đều có nhiều khả năng dẫn đầu về tích lũy doanh thu, kênh và quy mô thị trường. "Cập nhật liên tục" đang thay thế "phòng thủ trạng thái ổn định" và trở thành một chiến lược thực tế hơn trong kỷ nguyên AI.

"Tốc độ mang lại sự chiếm đóng của trí óc, và trí óc thúc đẩy thu nhập đóng cửa" đã trở thành một trong những logic tăng trưởng quan trọng nhất hiện nay. Nguồn vốn có thể phản hồi lại cho R&D, tăng cường lợi thế công nghệ và cuối cùng tạo thành hiệu ứng lăn cầu tuyết. Cơ chế này phù hợp hơn với động lực chu kỳ của các sản phẩm AI và thích ứng hơn với nhu cầu thị trường đang thay đổi nhanh chóng.

"Lãnh đạo năng động" đang thay thế "rào cản tĩnh" để trở thành bản chất của thế hệ hệ thống bảo vệ mới. Tiêu chuẩn để đo lường liệu một sản phẩm AI có thể tồn tại lâu dài hay không không còn là thị phần tĩnh trên thị phần nữa, mà là liệu nó có thể tiếp tục xuất hiện ở vị trí hàng đầu về công nghệ hay nhận thức của người dùng hay không.

“Hiệu ứng mạng” truyền thống vẫn chưa thể hiện đầy đủ trong các kịch bản AI. Hầu hết các sản phẩm vẫn đang trong giai đoạn “tạo nội dung” và chưa hình thành hệ sinh thái khép kín “thế hệ-tiêu dùng-tương tác”. Mối quan hệ người dùng vẫn chưa lắng đọng thành mạng lưới có cấu trúc và các nền tảng có hiệu ứng mạng lưới cấp độ xã hội vẫn đang trong quá trình hình thành.

Tuy nhiên, trong một số danh mục theo chiều dọc, các cấu trúc rào cản mới đã bắt đầu xuất hiện. Lấy tổng hợp giọng nói làm ví dụ, một số sản phẩm đã thiết lập ràng buộc quy trình trong nhiều kịch bản doanh nghiệp và xây dựng rào cản kép "hiệu quả + chất lượng" với các lần lặp lại thường xuyên và đầu ra chất lượng cao. Cơ chế này có thể trở thành một trong những con đường thực tế để xây dựng hệ thống bảo vệ sản phẩm hiện nay.

Về mặt trải nghiệm , một số nền tảng giọng nói đã cho thấy dạng phôi thai của hiệu ứng mạng. Thông qua việc mở rộng liên tục các cơ sở dữ liệu theo các tập hợp dữ liệu do người dùng tải lên và các mẫu giọng nói của nhân vật , các mô hình nền tảng nhận được phản hồi đào tạo liên tục, hình thành nên một chu kỳ tích cực về sự phụ thuộc của người dùng và nội dung. Ví dụ, đối với các nhu cầu giọng nói được nhắm mục tiêu như "phù thủy già", các nền tảng chính thống có thể cung cấp hơn 20 phiên bản chất lượng cao, trong khi các sản phẩm chung chỉ có hai hoặc ba phiên bản, phản ánh khoảng cách giữa độ sâu đào tạo và chiều rộng nội dung.

Con đường lắng đọng này ban đầu đã xây dựng một cơ chế độ bám thuộc nền tảng và độ bám dính của người dùng mới trong kịch bản cụ thể của việc tạo giọng nói. Mặc dù vẫn chưa đạt đến quy mô cấp nền tảng, nhưng nó đã hình thành dấu hiệu của một vòng lặp khép kín.

Liệu giọng nói có thể trở thành giao diện tương tác cơ bản của AI hay không cũng đang chuyển từ trí tưởng tượng kỹ thuật sang thực tế sản phẩm. Là hình thức tương tác thô sơ nhất của con người, giọng nói chưa bao giờ có thể trở thành kênh tương tác hiệu quả giữa người và máy tính mặc dù đã có nhiều vòng thử nghiệm thất bại trong vài thập kỷ qua, từ VoiceXML đến trợ lý giọng nói. Chỉ đến khi các mô hình tạo ra xuất hiện thì giọng nói mới có được nền tảng kỹ thuật để hỗ trợ "cổng thông tin tương tác toàn cầu".

Con đường triển khai AI giọng nói cũng đang nhanh chóng thâm nhập từ các ứng dụng dành cho người tiêu dùng sang các kịch bản doanh nghiệp. Mặc dù khái niệm ban đầu chủ yếu tập trung vào các huấn luyện viên AI, trợ lý tâm lý và các sản phẩm đồng hành, các ngành công nghiệp hiện đang chấp nhận giọng nói nhanh nhất là những ngành phụ thuộc tự nhiên vào giọng nói, chẳng hạn như dịch vụ tài chính và hỗ trợ khách hàng. Với tỷ lệ luân chuyển dịch vụ khách hàng cao, tính nhất quán của dịch vụ kém và chi phí tuân thủ lớn, lợi thế về khả năng kiểm soát và tự động hóa của giọng nói AI đang bắt đầu phản ánh giá trị hệ thống.

Một số công cụ đã được phát triển, chẳng hạn như Granola, đã bắt đầu đi vào kịch bản sử dụng doanh nghiệp. Mặc dù vẫn chưa có "sản phẩm giọng nói phổ quát", nhưng con đường đã được mở ra ban đầu.

Điều đáng chú ý hơn là giọng nói AI đang bước vào các kịch bản quan trọng với chi phí tin cậy cao và truyền tải thông tin có giá trị cao. Bao gồm chuyển đổi bán hàng, quản lý khách hàng, đàm phán hợp tác, giao tiếp văn hóa nội bộ, v.v., tất cả đều dựa vào đối thoại chất lượng cao và truyền tải phán đoán. Trong các kịch bản đối thoại phức tạp này, mô hình giọng nói tạo ra có khả năng thực hiện nhất quán, không bị gián đoạn và có thể kiểm soát được hơn con người.

Khi những loại hệ thống này tiếp tục phát triển trong tương lai, các công ty sẽ phải đánh giá hiểu biết cơ bản của mình về những người đối thoại quan trọng nhất trong tổ chức.

Đằng sau tất cả những xu hướng này, một phán đoán cấu trúc mới đang hình thành: hệ thống bảo vệ trong kỷ nguyên AI không còn đến từ số lượng người dùng hoặc ràng buộc sinh thái, mà đến từ độ sâu đào tạo mô hình, tốc độ phát triển sản phẩm và phạm vi tích hợp hệ thống. Các công ty có khả năng tích lũy sớm, cập nhật liên tục và phân phối tần suất cao đang sử dụng "nhịp điệu kỹ thuật" để định hình lại các rào cản kỹ thuật. Thế hệ cơ sở hạ tầng sản phẩm mới có thể đang dần hình thành trong những đường ray nhỏ có vẻ thẳng đứng này.

Roelof Botha của Sequoia Capital USA nói về các mô hình quan sát VC trong kỷ nguyên AI - AI không làm suy yếu sự tập trung như Internet, nhưng vẫn có những cơ hội về mặt cấu trúc

▍Bản sao AI hiểu bạn nhất

Sự phát triển của công nghệ giọng nói chỉ là sự khởi đầu. Khái niệm về avatar AI đang dần chuyển từ phòng thí nghiệm sang sản xuất hàng loạt. Ngày càng có nhiều đội ngũ bắt đầu suy nghĩ: Trong những tình huống nào con người sẽ thiết lập tương tác lâu dài với "bản thân tổng hợp" của họ?

Cốt lõi của bản sao AI không còn là "khuếch đại ảnh hưởng của đầu", mà là trao cho mọi người bình thường khả năng thể hiện và mở rộng bản thân. Trên thực tế, có lượng lớn cá nhân có kiến thức, kinh nghiệm và sức hấp dẫn cá nhân độc đáo, nhưng họ đã lâu không được biết đến do rào cản thể hiện và rào cản truyền thông. Sự phổ biến của bản sao AI đã cung cấp cho những cá nhân như vậy cơ sở hạ tầng để "được ghi lại, được gọi và được truyền lại" lần đầu tiên.

Tác nhân tính cách tri thức là một trong những con đường điển hình đã được hiện thực hóa. Ví dụ, trong hệ thống khóa học bằng giọng nói, giọng nói của giảng viên được xây dựng như một nhân vật tương tác, kết hợp với công nghệ tạo ra sự tăng cường truy xuất, để người dùng có thể đặt bất kỳ câu hỏi nào về khóa học và hệ thống tạo ra câu trả lời theo thời gian thực dựa trên kho dữ liệu khổng lồ. Khóa học không còn chỉ là phát lại nội dung thụ động nữa mà là sự tham gia tích cực của tính cách tri thức. Một tập hợp nội dung ban đầu mất vài giờ để xem được chuyển thành trải nghiệm hỏi đáp được cá nhân hóa có thể hoàn thành trong vài phút.

Điều này cho thấy tính cách kỹ thuật số đã tăng từ "lớp trình bày nội dung" lên "lối vào tương tác nhận thức". Khi avatar AI có thể liên tục trình bày một mô hình tính cách quen thuộc, lý tưởng và thậm chí vượt qua trải nghiệm giao tiếp thực tế về mặt ngữ nghĩa, nhịp điệu và cấu trúc cảm xúc, thì sự tin tưởng và phụ thuộc mà người dùng xây dựng trên đó sẽ vượt qua cấp độ công cụ và bước vào phạm vi xây dựng của "mối quan hệ tâm lý".

Con đường tiến hóa này cũng thúc đẩy sự đổi mới các khái niệm nhận thức. Các tương tác kỹ thuật số trong tương lai có thể được chia thành hai dạng cốt lõi: một là tính cách mở rộng được xây dựng xung quanh những người thực (chẳng hạn như dạng mở rộng của người cố vấn, thần tượng, người thân và bạn bè), và dạng còn lại là "người khác lý tưởng ảo" được tạo ra dựa trên sở thích của người dùng và các thiết lập lý tưởng. Mặc dù dạng sau chưa bao giờ thực sự tồn tại, nhưng nó có thể hình thành mối quan hệ đồng hành và phản hồi cực kỳ hiệu quả.

Xu hướng này cũng đã bắt đầu xuất hiện trong lĩnh vực sáng tạo. Một số cá nhân có tập đoàn công khai đang được "nhân bản" thành tài sản cá nhân kỹ thuật số có thể gọi được và trong tương lai, họ có thể tham gia vào sản xuất nội dung, tương tác xã hội và ủy quyền thương mại như một phần của IP cá nhân, định hình lại "ranh giới cá nhân" và "phương pháp thể hiện".

“Những người nổi tiếng AI” đã ra đời. Một loại là thần tượng hình ảnh hoàn toàn hư cấu, được xây dựng hoàn toàn bằng các mô hình sinh sản về mặt hình ảnh, giọng nói và hành vi; loại còn lại là nhiều hình đại diện kỹ thuật số của các ngôi sao thực sự, tương tác với người dùng ở các trạng thái tính cách khác nhau trên các nền tảng khác nhau. Những “nhân vật văn hóa AI” này đã được thử nghiệm trên các mạng xã hội lượng lớn, với độ trung thực của hình ảnh, tính nhất quán về hành vi và độ sâu của mô hình ngữ nghĩa là các chiều đánh giá.

Trong hệ sinh thái nội dung, các công cụ AI đã hạ thấp ngưỡng sáng tạo, nhưng không thay đổi được sự khan hiếm của nội dung chất lượng cao. Nội dung hấp dẫn vẫn phụ thuộc vào phán đoán thẩm mỹ, căng thẳng tâm lý và biểu đạt liên tục của người sáng tạo. AI đóng vai trò hỗ trợ "logic thực hiện" hơn là thay thế cho "động lực sáng tạo".

Một nhóm "người sáng tạo được giải phóng bằng công cụ" đang nổi lên. Họ có thể không có bối cảnh nghệ thuật truyền thống, nhưng họ đã đạt được sự giải phóng ý định biểu đạt của mình thông qua các công cụ AI. AI cung cấp lối vào, không phải là kết thúc của kênh. Liệu họ có thể nổi bật vào cuối cùng hay không vẫn phụ thuộc vào khả năng cá nhân, tính độc đáo của chủ đề và cấu trúc tường thuật.

Cách thể hiện này đã được phản ánh trong các sản phẩm nội dung. Ví dụ, nội dung video dưới dạng "phỏng vấn trên phố ảo" về cơ bản là tương tác có cấu trúc với nhân vật do AI tạo ra. Nhân vật có thể là yêu tinh, phù thủy và sinh vật kỳ ảo. Nền tảng này có thể tạo toàn bộ các cuộc hội thoại và cảnh chỉ bằng một cú nhấp chuột, hoàn thành toàn bộ quá trình tự động hóa từ thiết lập nhân vật, logic ngôn ngữ đến kết xuất video. Cơ chế này đã nhận được sự chú ý cao trên nhiều nền tảng và nó cũng chỉ ra rằng hình thức sản phẩm của AI tường thuật đang hình thành.

Có một xu hướng tương tự trong lĩnh vực âm nhạc, nhưng vẫn còn những thách thức về khả năng biểu đạt và tính ổn định của đầu ra mô hình. Vấn đề lớn nhất với âm nhạc AI hiện nay là độ lệch "trung bình". Các mô hình tự nhiên có xu hướng phù hợp với trung tâm và nội dung nghệ thuật thực sự có tác động thường đến từ các xung đột văn hóa "không trung bình", các cực đoan tâm lý và sự cộng hưởng của thời đại.

Điều này không phải vì mô hình không đủ khả năng, mà vì mục tiêu của thuật toán không bao quát được logic căng thẳng của nghệ thuật. Nghệ thuật không "chính xác" mà là "ý nghĩa mới trong xung đột". Điều này cũng thúc đẩy mọi người suy nghĩ lại: AI có thể tham gia vào việc tạo ra nội dung độ sâu về văn hóa, thay vì chỉ là accelerator cho sự thể hiện lặp đi lặp lại?

Cuộc thảo luận này cuối cùng tập trung vào giá trị của "tình bạn AI". Mối quan hệ giữa AI và con người có thể là một trong những kịch bản trưởng thành sớm nhất và hứa hẹn nhất về mặt thương mại.

Trong các sản phẩm đồng hành ban đầu, lượng lớn người dùng cho biết ngay cả các phản ứng mô phỏng cũng hình thành nên một vùng an toàn về mặt tâm lý. AI không cần phải thực sự "hiểu", miễn là nó có thể xây dựng được trải nghiệm chủ quan về "được lắng nghe", nó có thể làm giảm sự cô đơn, lo lắng và mệt mỏi về mặt xã hội. Đối với một số người, tương tác mô phỏng này thậm chí còn là một cơ chế tiên quyết để xây dựng lại các kỹ năng xã hội thực sự.

Mối quan hệ AI không chỉ là những chất tăng cường vùng thoải mái. Ngược lại, sự đồng hành có giá trị nhất có thể đến từ những thách thức về nhận thức mà nó mang lại. Nếu AI có thể đặt câu hỏi, hướng dẫn xung đột và thách thức nhận thức vốn có một cách phù hợp, nó có thể trở thành người hướng dẫn trên con đường phát triển tâm lý thay vì là người xác nhận. Logic tương tác đối đầu này là hướng thực sự đáng để phát triển trong hệ thống avatar AI trong tương lai.

Xu hướng này cũng cho thấy vị trí chức năng mới của công nghệ: từ các công cụ tương tác đến "cơ sở hạ tầng tâm lý". Khi AI có thể tham gia vào việc điều chỉnh tâm lý, hỗ trợ mối quan hệ và cập nhật nhận thức, nó không còn chỉ mang khả năng văn bản hoặc giọng nói mà còn là cơ chế mở rộng của hành vi xã hội.

Đề xuất cuối cùng của tình bạn AI không phải là mô phỏng các mối quan hệ, mà là cung cấp các kịch bản hội thoại khó xây dựng trong trải nghiệm của con người. Trong nhiều kịch bản như gia đình, giáo dục, tâm lý và văn hóa, ranh giới giá trị của các avatar AI đang được mở rộng - không chỉ là người phản hồi, mà còn là người đối thoại và người định hình mối quan hệ.

▍Bước tiếp theo cho các thiết bị đầu cuối AI chính là mạng xã hội

Sau các bản sao AI, người bạn đồng hành ảo và tác nhân giọng nói, sự chú ý của ngành công nghiệp đang chuyển hướng trở lại cấp độ phần cứng và nền tảng—liệu có khả năng tái Sự lật đổ phá các hình thức tương tác giữa con người và máy tính trong tương lai hay không?

a16 cho rằng, một mặt, địa vị của điện thoại thông minh như nền tảng tương tác chính vẫn rất ổn định, với hơn 7 tỷ điện thoại thông minh được triển khai trên toàn thế giới và mức độ phổ biến, tính độ bám sinh thái và thói quen sử dụng của nó khó có thể bị lung lay trong ngắn hạn. Mặt khác, những khả năng mới đang hình thành trong các thiết bị cá nhân và thiết bị tương tác liên tục.

Một con đường là "tiến hóa bên trong điện thoại di động": mô hình đang hướng tới triển khai cục bộ và vẫn còn nhiều chỗ để tối ưu hóa xung quanh bảo vệ quyền riêng tư, nhận dạng ý định và tích hợp hệ thống. Một con đường khác là phát triển các dạng thiết bị mới, chẳng hạn như tai nghe "luôn trực tuyến", kính, thiết bị trâm cài, v.v., tập trung vào khởi động không cảm biến, điều khiển bằng giọng nói và tiếp xúc chủ động.

Biến số quyết định thực sự vẫn có thể là sự đột phá về khả năng của mô hình hơn là sự thay thế các yếu tố hình thức phần cứng. Các yếu tố hình thức phần cứng cung cấp các thiết bị mang ranh giới cho khả năng của mô hình, trong khi khả năng của mô hình xác định giới hạn trên của giá trị thiết bị.

AI không chỉ là một hộp nhập liệu trên trang web mà còn phải là một sự hiện diện "sống cùng bạn". Quan điểm này ngày càng trở thành sự đồng thuận của ngành. Nhiều nỗ lực ban đầu đã bắt đầu khám phá con đường "AI hiện diện": AI có thể nhìn thấy hành vi của người dùng, nghe giọng nói theo thời gian thực, hiểu hoàn cảnh tương tác và chủ động can thiệp vào quá trình ra quyết định. Chuyển đổi từ nhà cung cấp gợi ý sang người tham gia hành vi đã trở thành một trong những hướng chuyển đổi chính để triển khai AI.

Một số thiết bị có thể ghi lại dữ liệu ngôn ngữ và hành vi của người dùng theo thời gian thực để theo dõi ngược và nhận dạng mẫu hành vi. Ngoài ra còn có các sản phẩm cố gắng chủ động đọc thông tin màn hình của người dùng và cung cấp các gợi ý hoạt động hoặc thậm chí là thực hiện trực tiếp. AI không còn là một công cụ phản hồi nữa mà là một phần của quá trình sống.

Một câu hỏi nữa là: AI có thể giúp người dùng hiểu được chính mình không? Khi không có hệ thống phản hồi bên ngoài, hầu hết mọi người đều thiếu sự hiểu biết có hệ thống về khả năng, thành kiến nhận thức và thói quen hành vi của chính mình. Một avatar AI đồng hành cùng người dùng trong thời gian đủ dài và có thể hiểu được con đường của người dùng có thể trở thành một cơ chế thông minh để hướng dẫn quá trình thức tỉnh nhận thức và giải phóng tiềm năng.

Ví dụ, nó có thể chỉ ra cho người dùng: "Nếu bạn dành 5 giờ mỗi tuần cho một hoạt động nhất định, bạn sẽ có 80% cơ hội trở thành chuyên gia trong lĩnh vực này trong ba năm"; hoặc đề xuất các kết nối cá nhân phù hợp nhất với cấu trúc sở thích và mô hình hành vi của họ, từ đó xây dựng biểu đồ xã hội chính xác hơn.

Cốt lõi của loại hệ thống quan hệ thông minh này là AI không còn là một công cụ chức năng được sử dụng không liên tục nữa mà được nhúng vào cấu trúc trong cuộc sống của người dùng. Nó đi kèm với công việc, hỗ trợ tăng trưởng và cung cấp phản hồi. Đó là mối quan hệ "bạn đồng hành kỹ thuật số" liên tục.

Về mặt thiết bị, tai nghe được coi là dạng thiết bị đầu cuối có khả năng mang loại trợ lý AI này nhất. Tai nghe, đại diện là AirPods, đeo tự nhiên, có kênh thoại mượt mà và có hai lợi thế là khả năng chống tương tác thấp và đeo lâu dài. Tuy nhiên, nhận thức xã hội của chúng trong các tình huống công cộng vẫn còn hạn chế - giả định văn hóa rằng "đeo tai nghe = không chào đón giao tiếp" vẫn đang ảnh hưởng đến con đường phổ biến thiết bị.

Sự phát triển về hình thức thiết bị không chỉ là vấn đề kỹ thuật mà còn là sự định nghĩa lại bối cảnh xã hội.

Sau khi ghi âm bền vững trở thành xu hướng mặc định trong ngành, các thói quen xã hội mới cũng đang được xây dựng lại. Kỷ nguyên "ghi âm mặc định" đang âm thầm diễn ra trong thế hệ người dùng trẻ.

Mặc dù việc ghi âm liên tục mang lại sự lo lắng về quyền riêng tư và sự phản ánh về mặt đạo đức, mọi người đang dần hình thành sự đồng thuận về mặt văn hóa rằng "ghi âm là bối cảnh". Ví dụ, trong một số bối cảnh công việc và xã hội hỗn hợp ở San Francisco, "việc ghi âm sự tồn tại" đã dần được nội tâm hóa thành một thiết lập mặc định; trong khi ở những khu vực như New York, sự khoan dung về mặt văn hóa tương tự vẫn chưa được hình thành. Sự khác biệt về tốc độ chấp nhận và thích ứng của các thử nghiệm công nghệ giữa các thành phố đang trở thành các biến số nhỏ trong tốc độ đưa sản phẩm AI ra thị trường.

Khi ghi lại những thay đổi về hành vi từ việc lựa chọn công cụ sang bối cảnh xã hội, việc tái thiết thực sự các chuẩn mực sẽ xoay quanh "thiết lập ranh giới" và "xây dựng giá trị".

Hiện tại chúng ta đang ở "giai đoạn đầu của quá trình xây dựng đồng thời các con đường kỹ thuật và chuẩn mực xã hội" - có nhiều khoảng cách, ít sự đồng thuận và các định nghĩa không rõ ràng. Nhưng đây là giai đoạn quan trọng nhất để nêu câu hỏi, thiết lập ranh giới và định hình trật tự.

Cho dù đó là hình đại diện AI, tác nhân giọng nói, tính cách kỹ thuật số, bạn đồng hành ảo hay hình thức phần cứng, sự chấp nhận của xã hội và các điểm xung đột văn hóa, toàn bộ hệ sinh thái vẫn ở trạng thái nguyên thủy và chưa được xác định nhất. Điều này có nghĩa là trong vài năm tới, nhiều giả định sẽ bị bác bỏ và sẽ có những con đường được khuếch đại nhanh chóng, nhưng chìa khóa là tiếp tục nêu ra những câu hỏi thực sự ở giai đoạn này và xây dựng một cấu trúc câu trả lời bền vững hơn.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan