Sau nhiều vòng hé lộ, con đường tìm kiếm AI cuối cùng cũng chào đón một "người chơi quan trọng" - SearchGPT, công cụ tìm kiếm dựa trên AI do OpenAI ra mắt.
Ngay từ tháng 4 năm nay, các kỹ sư đã tung ra thông tin rằng OpenAI đang đánh giá nội bộ sản phẩm tìm kiếm AI SONIC-SNC (SearchGPT) của riêng mình; vào đầu tháng 5, tin tức về việc OpenAI sắp phát hành một sản phẩm tìm kiếm đã được lan truyền rộng rãi trên mạng. Tuy nhiên, phải đến ba tháng sau, SearchGPT của OpenAI mới chính thức ra mắt.
Sự ra mắt của SearchGPT không có gì đáng ngạc nhiên, điều mà mọi người quan tâm hơn cả là liệu tìm kiếm AI có hoạt động hay không và liệu có cơ hội nào để chiếm lấy thị thị phần của các công cụ tìm kiếm truyền thống hay không?
Giám đốc điều hành OpenAI Sam Altman (Sam Altman) có vẻ rất tự tin vào điều này. Ông gọi SearchGPT là "nguyên mẫu mới (nguyên mẫu sản phẩm mới)" và thẳng thắn nói: "Chúng tôi cho rằng vẫn còn chỗ để cải thiện trong tìm kiếm ngày nay". Anh cũng cho biết, so với công cụ tìm kiếm "cũ", SearchGPT mới khiến anh ngạc nhiên. Trong khi anh không ngần ngại khen ngợi sản phẩm mới của mình thì anh cũng không hề giữ thể diện cho các đối thủ như Google và Bing.
SearchGPT, nguồn ảnh: OpenAI
Hiện tại, sự cạnh tranh trong lĩnh vực tìm kiếm AI rất khốc liệt. Không chỉ có các sản phẩm xuất sắc ở nước ngoài như New Bing, Perplexity, You.com, Lepton Search, Genspark và Hebbia mà còn có MiTa AI Search, 360 AI Search. , Tiangong AI Search và Bocha AI search, Reportify, Devv và các sản phẩm nội địa khác đang phát triển nhanh chóng.
Khi nói về SearchGPT, Zhou Hongyi, người sáng lập 360 Group, nói với Jiazi Guannian: “OpenAI ban đầu tạo ra ChatGPT. Họ cảm thấy rằng giao diện trò chuyện có thể giải quyết một số vấn đề, nhưng giờ họ phải tạo SearchGPT song song như một trải nghiệm người dùng mới. Chúng tôi vẫn chưa biết liệu Tìm kiếm hay Trò chuyện tốt hơn. Nó có thể được chia đều hoặc cái này có thể được thay thế bằng cái kia, nhưng điều này ít nhất cho thấy rằng tìm kiếm AI là một lối vào cảnh quan trọng mà không ai có thể bỏ lỡ.”
Người ta nói rằng tìm kiếm AI rất quan trọng, nhưng một thách thức mà tìm kiếm AI phải đối mặt là làm thế nào để thiết lập một mô hình kinh doanh. "Nếu chi phí rất thấp, bạn có thể sử dụng quảng cáo, nhưng hiện tại rất khó đặt quảng cáo. Quảng cáo có thể không trang trải được chi phí cho mỗi lần tìm kiếm từ", Zhou Hongyi nói, "Không phải tất cả người dùng đều sẵn sàng trả tiền. Điều này cần phải làm." được khám phá."
Trong bài viết này, "Jiazi Guannian" sẽ tháo dỡ SearchGPT và các sản phẩm tìm kiếm AI liên quan, đồng thời phân tích các rào cản, đột phá và tương lai của các sản phẩm tìm kiếm AI.
1.Tìm kiếm AI không phải là tìm kiếm
Để hiểu được ưu điểm của các sản phẩm tìm kiếm OpenAI, trước tiên bạn phải hiểu nguyên tắc hoạt động cơ bản của các sản phẩm tìm kiếm AI.
Hiện trên thị trường có ba loại sản phẩm tìm kiếm AI chính, đó là sản phẩm tìm kiếm AI chuyên dụng, sản phẩm có khả năng AI do các công cụ tìm kiếm truyền thống tung ra và sản phẩm có khả năng tìm kiếm do các nhà sản xuất mô hình lớn sản xuất .
Danh mục đầu tiên được đại diện bởi Perplexity, Secret Tower AI Search và Genspark, danh mục thứ hai được đại diện bởi New Bing và Tổng quan về Google AI và danh mục thứ ba được đại diện bởi Kimi, Doubao và Tencent Yuanbao. Mặc dù OpenAI cũng là một nhà sản xuất mô hình lớn nhưng vì họ có một sản phẩm mô hình lớn là ChatGPT nên họ đã phát triển lại một sản phẩm tìm kiếm AI chuyên dụng và SearchGPT do đó rơi vào loại đầu tiên.
Nguyên tắc cơ bản của tìm kiếm AI thực sự có thể được tóm tắt là "RAG (Thế hệ tăng cường truy xuất)", bao gồm hai bước: Truy xuất và Tạo. Trong đó, hầu hết việc "Truy xuất (truy xuất)" được hoàn thành bằng API của các công cụ tìm kiếm truyền thống và một phần nhỏ sử dụng các thư viện chỉ mục tự xây dựng và công việc chính mà các sản phẩm tìm kiếm AI làm là "Tạo" sau khi nhận được results.)", sử dụng AI thay thế lao động thủ công, đọc nội dung tìm kiếm và đưa ra câu trả lời trực tiếp cho người dùng sau khi tổng hợp.
Tất nhiên, Chuỗi đằng sau việc này sẽ phức tạp hơn, bao gồm một số liên kết quan trọng như viết lại câu hỏi (Intent Development), sắp xếp lại kết quả truy xuất (Reranking) và lấy nội dung chi tiết (Đọc nội dung). nó cũng cần phải xử lý trước kết quả tìm kiếm và hiển thị các giải pháp tìm kiếm. Toàn bộ quá trình tìm kiếm AI sẽ bao gồm lần lệnh gọi đến các mô hình lớn. Ví dụ: 360 sẽ gọi lần mô hình lớn để thực hiện tìm kiếm AI.
Sơ đồ luồng tìm kiếm AI, nguồn ảnh: Sản phẩm AI Rena
Biểu đồ quy trình làm việc của mô hình kiến trúc cộng tác chuyên gia hơn 360 (CoE), nguồn ảnh: được chụp bởi "Jiazi Guannian"
Nhưng nhìn chung, các sản phẩm tìm kiếm AI vẫn được phát triển dựa trên các sản phẩm tìm kiếm hoàn thiện. Bước truy xuất có thể được giải quyết bằng cách gọi các API bên ngoài và các bước nâng cao, tóm tắt và tạo ngữ cảnh chỉ cần gọi các khả năng của mô hình lớn cơ bản. Nói cách khác, so với các sản phẩm tìm kiếm truyền thống, các sản phẩm tìm kiếm AI không phải là những đổi mới ở cấp độ kỹ thuật mà là nhiều đổi mới hơn ở cấp độ sản phẩm.
Đây là lý do tại sao Perplexity tự gọi mình là " công cụ trả lời " - là một sản phẩm được "bóc tách" trực tiếp từ API tìm kiếm sang mô hình lớn cơ bản, Perplexity không cung cấp khả năng tìm kiếm trực tiếp mà có được chúng thông qua quyền truy cập vào API. nội dung được công cụ tìm kiếm truy xuất, câu trả lời được tóm tắt qua các mô hình lớn như GPT-4 và Claude, cuối cùng được tổ chức thành định dạng cố định và trình bày cho người dùng, giúp người dùng tiết kiệm thời gian xem và tóm tắt theo từng trang.
Có thể sử dụng “vỏ” để đạt mức định giá 3 tỷ USD, có thể nói chiến thắng của Perplexity, “vua vỏ” không phải là thắng lợi về công nghệ mà là thắng lợi của việc đóng gói sản phẩm dựa trên công nghệ. Đó là kết quả của những hiểu biết chính xác về nhu cầu của người dùng, chiến thắng của một cuộc tấn công nhanh chóng.
Nguồn ảnh: Lúng túng
Vì vậy, tìm kiếm AI không phải là tìm kiếm mà là tóm tắt. Sự cạnh tranh thực sự giữa các sản phẩm tìm kiếm AI không phải là khả năng kỹ thuật cơ bản mà là ai có thể đưa ra câu trả lời chính xác hơn, tốc độ phản hồi nhanh hơn và trải nghiệm người dùng thông minh hơn dựa trên công nghệ.
Trong đó, “độ chính xác” là điểm quan trọng nhất. Rào cản lớn nhất đối với tìm kiếm AI là dữ liệu . Để có được câu trả lời chính xác, chất lượng và số lượng của dữ liệu cơ bản là rất quan trọng . Chỉ khi cơ sở dữ liệu cơ bản đủ lớn, chứa đủ thông tin, cập nhật thông tin đủ kịp thời thì mô hình lớn mới đảm bảo “dựa trên bằng chứng” khi thu thập nội dung, từ đó tổng hợp và xuất ra nội dung chính xác, kịp thời hơn. Đây cũng là lý do Google duy trì thị phần hơn 90% trong lĩnh vực công cụ tìm kiếm quanh năm - họ đã lập chỉ mục từ ngày đầu tiên thành lập vào năm 1998 và có thư viện chỉ mục lớn nhất và toàn diện nhất trên thế giới. thế giới, có thể cung cấp kết quả tìm kiếm chính xác và kịp thời nhất.
Vì vậy, nếu muốn kết quả tìm kiếm chính xác hơn, việc xây dựng cơ sở dữ liệu chỉ mục của riêng mình là một giải pháp quan trọng.
Hiện tại, đại đa số các sản phẩm tìm kiếm AI chỉ được kết nối với API của các công cụ tìm kiếm truyền thống mà không tạo lại hệ thống tìm kiếm cấp dưới. Chỉ một số ít như Secret Tower AI Search (phần podcast và thư viện), 360AI Search và. một vài ngành dọc Công cụ tìm kiếm AI xây dựng cơ sở dữ liệu chỉ mục. Điều này chủ yếu là do việc truy cập API của các công cụ tìm kiếm truyền thống đã có thể giải quyết được 95% vấn đề. Ngoài ra, chi phí xây dựng thư viện chỉ mục tự xây dựng rất cao và đòi hỏi lượng lớn nhân lực, tài chính và thời gian. thư viện chỉ mục tự xây dựng không thể cung cấp hiệu suất tốt hơn Google. Để có nội dung chất lượng cao hơn với API của Bing, bạn không cần phải xây dựng thư viện chỉ mục của riêng mình.
Biểu đồ luồng tìm kiếm AI Nguồn ảnh: Nhà sáng lập ThinkAny idoubi, biên tập viên sản phẩm AI Huang Shu
Chi phí để xây dựng cơ sở dữ liệu chỉ mục của riêng bạn là bao nhiêu? Liang Zhihui, phó chủ tịch của 360, từng nói trong một podcast rằng chi phí thu thập dữ liệu 50 triệu trang web là khoảng 1 triệu đến 2 triệu nhân dân tệ, nhưng 50 triệu trang web là một con số rất nhỏ đối với một công cụ tìm kiếm. engine, ít nhất 100 tỷ trang web phải được thu thập dữ liệu; nếu bạn muốn lập chỉ mục các trang web toàn cầu, về cơ bản bạn cần 3.000 đến 10.000 máy chủ để cung cấp hỗ trợ.
Nói cách khác, để xây dựng công cụ tìm kiếm đơn giản nhất, bạn cần có ngân sách ít nhất từ 2 tỷ đến 4 tỷ nhân dân tệ. Con số này chưa bao gồm chi phí máy chủ PageRank (xếp hạng trang web), chi phí phí bảo vệ của nhà sản xuất thiết bị đầu cuối, và chi phí nhân sự. Đây là một chi phí không thể vượt qua đối với bất kỳ công ty khởi nghiệp vừa và nhỏ nào.
Đây cũng là lý do tại sao hiện nay chỉ có một số công ty lớn như Google, Microsoft, Baidu sản xuất công cụ tìm kiếm. Chi phí chế tạo công cụ tìm kiếm quá cao và chỉ có các công ty lớn mới có đủ vốn, nhân tài và thiết bị để làm việc đó. .
Ngoài chi phí cao, công nghệ và thuật toán tìm kiếm cũng khá khó khăn. Lấy thuật toán xếp hạng đáng tự hào của Google làm ví dụ. Nó tính đến hàng trăm yếu tố khác nhau, bao gồm chất lượng nội dung, trải nghiệm người dùng, tính thân thiện với thiết bị di động, tốc độ tải trang, bảo mật, v.v. Nó không chỉ phức tạp về cấu trúc mà còn dựa trên bề ngoài. thế giới. Hoàn cảnh được cập nhật theo thời gian thực. Được biết, Google tung ra trung bình lần bản cập nhật thuật toán mỗi ngày, lên tới 2.000 lần một năm; và thuật toán này cực kỳ bí mật, và rất ít người trong Google biết bức tranh đầy đủ về thuật toán xếp hạng tìm kiếm của nó.
Có thể hình dung rằng với chi phí khổng lồ và ngưỡng kỹ thuật cực cao như vậy, việc các công cụ tìm kiếm vừa và nhỏ/các công ty tìm kiếm AI xây dựng thư viện chỉ mục của riêng mình cho toàn bộ mạng cũng khó như thể họ đang cố gắng chuyển núi.
Tuy nhiên, điều này khó sụp đổ các công ty vừa và nhỏ nhưng sụp đổ OpenAI.
Là một công ty có số tiền tài trợ tích lũy hơn 20 tỷ USD và được biết đến với mật độ nhân tài cao, OpenAI đương nhiên không thiếu “tiền” và “con người”. Vì vậy, họ hoàn toàn có khả năng xây dựng cơ sở dữ liệu chỉ mục của riêng mình.
Vậy SearchGPT có thư viện chỉ mục riêng không?
Sau khi "Jiazi Guannian" hỏi một số kỹ sư, câu trả lời chung mà họ nhận được là: "Với nguồn vốn và tài năng của OpenAI, nó có khả năng xây dựng cơ sở dữ liệu chỉ mục của riêng mình, nhưng chỉ vì việc xây dựng cơ sở dữ liệu chỉ mục cho toàn bộ mạng là quá thời gian- tốn kém, tốn nhiều công sức và tốn kém. Lẽ ra họ phải xây dựng một phần thư viện chỉ mục, nhưng họ sẽ không từ bỏ quyền truy cập vào các API tìm kiếm bên ngoài và sử dụng trình thu thập thông tin để thực hiện tìm kiếm theo thời gian thực nhằm bổ sung cho các câu trả lời.”
Phương tiện truyền thông công nghệ testingCatalog News đã phát hiện ra mã nguồn của SearchGPT, xác nhận suy đoán này - họ phát hiện ra rằng SearchGPT vẫn được kết nối với API của thư viện chỉ mục Bing, nhưng không giống như chức năng tìm kiếm chung Bing hiện do ChatGPT cung cấp, SearchGPT cung cấp thông tin thực tế tốt hơn thông tin thời gian. Điều này chủ yếu đạt được bởi trình thu thập dữ liệu web.
Nguồn ảnh: Tin tức testingCatalog
Một tuyên bố trên trang nhà phát triển OpenAI tiếp tục xác nhận suy đoán này. Họ viết trong phần tổng quan về nền tảng nhà phát triển: “OpenAI sử dụng trình thu thập dữ liệu web và tác nhân người dùng để thực hiện các hành động cho các sản phẩm của mình được tự động hóa hoặc kích hoạt theo yêu cầu của người dùng”.
Nguồn hình ảnh: Nền tảng OpenAI
Tóm lại, SearchGPT có thể sẽ áp dụng lộ trình kỹ thuật kết hợp " cơ sở dữ liệu chỉ mục một phần tự xây dựng + quyền truy cập vào API của Bing + trình thu thập dữ liệu web thời gian thực " để đảm bảo kết quả tìm kiếm chính xác và kịp thời.
Ngoài thư viện chỉ mục của riêng mình, một rào cản dữ liệu khác mà OpenAI đã thiết lập cho các sản phẩm tìm kiếm AI của mình là nội dung .
Trên trang phát hành của SearchGPT, OpenAI đã đề cập rằng họ cam kết xây dựng một hệ sinh thái thịnh vượng gồm các nhà xuất bản và người sáng tạo để giúp người dùng khám phá các trang web và trải nghiệm của nhà xuất bản, đồng thời mang lại nhiều lựa chọn hơn cho tìm kiếm.
Các phương tiện truyền thông mà họ hợp tác bao gồm Axel Springer, công ty mẹ của The Atlantic Monthly, Associated Press và Business Insider, cũng như gã khổng lồ truyền thông News Corp, công ty sở hữu The Wall Street Journal, The Times và The Sun. OpenAI cố gắng trao đổi các liên kết được đề xuất để có quyền thu thập thông tin các nội dung phương tiện này. Nó cũng tuyên bố rằng phương tiện truyền thông và nhà xuất bản có thể chọn cách trình bày các nguồn nội dung trong SearchGPT.
Hợp tác với các nhà cung cấp thông tin chuyên nghiệp như phương tiện truyền thông tổ chức là một đòn mạnh của OpenAI vào các đối thủ cạnh tranh. Do sự tồn tại của tường phí và cơ chế chống thu thập thông tin, nhiều sản phẩm tìm kiếm AI không thể nắm bắt được nội dung do các tổ chức truyền thông chuyên nghiệp cung cấp, điều này cũng dẫn đến kết quả không đầy đủ do các sản phẩm tìm kiếm AI tạo ra và trải nghiệm kém. Sau khi thiết lập quan hệ hợp tác với giới truyền thông, nhiều báo cáo độc quyền về phương tiện truyền thông có thể được tìm kiếm trong SearchGPT, điều này chắc chắn sẽ thúc đẩy hệ sinh thái nội dung của SearchGPT và đảm bảo trải nghiệm người dùng của nó.
Ngoài việc hoàn thiện hệ sinh thái dữ liệu và dữ liệu cơ bản, việc thiết lập mối quan hệ hợp tác với giới truyền thông cũng là một động thái có chủ ý của OpenAI nhằm đảm bảo tuân thủ bản quyền.
Kể từ khi ChatGPT ra mắt, đã có vô số vụ kiện bản quyền xung quanh các sản phẩm AI tổng hợp. Ví dụ: New York Times đã chi 1 triệu USD khởi kiện OpenAI và Microsoft, cùng 8 nhóm xuất bản thuộc Quỹ phòng hộ Alden Global Capital (bao gồm cả). New York Daily News) Daily News và Chicago Tribune) cũng đã đệ đơn kiện hai công ty này. Perplexity, cũng là một sản phẩm AI tổng hợp, cũng đã nhận được thư của luật sư từ Forbes vì sử dụng báo cáo của Forbes trong kết quả tìm kiếm mà không trích dẫn nguồn chính xác.
Vì vậy, thiết lập cơ chế hợp tác lành mạnh với các phương tiện truyền thông và nhà xuất bản không chỉ có thể có được nhiều nguồn nội dung hơn mà còn tránh được nhiều tranh chấp bản quyền không cần thiết trong tương lai, có thể có cơ hội kiếm tiền thông qua quảng cáo. bằng một viên đá.
Cho dù nó xây dựng cơ sở dữ liệu chỉ mục của riêng mình hay có được nội dung độc quyền thông qua hợp tác với giới truyền thông, nó sẽ giúp SearchGPT có được dữ liệu chất lượng cao, thiết lập các rào cản về dữ liệu và nội dung, sau đó đạt được lợi thế đi sau nhất định trong tìm kiếm AI vốn đã đầy khói thuốc chiến tranh. .
2. Tái tạo trải nghiệm người dùng với độ trễ thấp và đa phương thức
Nếu việc xây dựng cơ sở dữ liệu chỉ mục của riêng mình và hợp tác với giới truyền thông là những rào cản dữ liệu đầu tiên mà OpenAI đã thiết lập cho chính mình, thì độ trễ cực thấp, nhiều vòng tương tác hỏi đáp và trình bày kết quả đa phương thức là những rào cản thứ hai mà OpenAI đã thiết lập cho trải nghiệm nó.
Chúng tôi đã đề cập trước đó rằng tìm kiếm AI không phải là tìm kiếm mà là một bản tóm tắt. Bản thân công nghệ AI đã giải quyết được vấn đề “khớp thông tin”. Mục đích của người dùng sử dụng tìm kiếm AI không chỉ đơn thuần là lấy thông tin mà còn là “thuê” sản phẩm đáp ứng nhu cầu của họ. Mặc dù công nghệ mô hình lớn sẽ tăng cường khả năng tìm kiếm ban đầu ở một mức độ nhất định, nhưng nếu muốn tạo ra một sản phẩm tìm kiếm AI tốt, ngoài mức độ thông tin, bạn còn phải làm việc chăm chỉ ở phía người dùng và tương tác sáng tạo với người dùng. để bên thông tin và bên tương tác "lăn trên hai bánh" chúng ta có thể tạo ra những sản phẩm tìm kiếm AI phi thường.
Loại tương tác nào có thể mang lại trải nghiệm tốt cho người dùng?
Nhà phát triển độc lập và người sáng lập ThinkAny, idoubi (Ai Doubi) đã đề cập trong bài viết đánh giá 10.000 từ của mình về công cụ tìm kiếm AI: “ Ba điểm quan trọng nhất để tạo nên một công cụ tìm kiếm AI tốt là chính xác/nhanh/ổn định, tức là phản hồi kết quả phải chính xác, tốc độ phản hồi phải nhanh và độ ổn định của dịch vụ phải cao ”.
Cơ sở dữ liệu chỉ mục tự xây dựng và hợp tác với các cơ quan truyền thông nêu ở bài trước đảm bảo “chính xác”, nhưng làm sao đảm bảo “nhanh” và “ổn định”?
Điều quan trọng là giảm bớt sự chậm trễ trong việc trả lời và có thể tiến hành nhiều vòng hỏi đáp.
SearchGPT cũng đạt được độ trễ phản hồi thấp. Từ video demo, chúng ta có thể thấy tốc độ phản hồi của SearchGPT rất nhanh, từ khi nhập câu hỏi đến khi đưa ra câu trả lời chỉ mất 1-2 giây.
Phản hồi có độ trễ thấp của SearchGPT, nguồn video: OpenAI
Nếu video chính thức vẫn bị nghi ngờ đã chỉnh sửa thì video trải nghiệm do một số cư dân mạng có tư cách trải nghiệm đăng tải đã loại bỏ nghi ngờ này. Qua video, chúng tôi nhận thấy tốc độ phản hồi của SearchGPT quả thực rất nhanh, từ khi đặt câu hỏi đến khi đưa ra câu trả lời chỉ mất 3 giây.
Video đo thực tế SearchGPT, nguồn video: X @Paul Covert
Làm thế nào đạt được "thời gian thực" cực cao này? Có hai cách: cách thứ nhất là thu thập dữ liệu trước và nhúng vào cơ sở dữ liệu vectơ, cách thứ hai là tìm kiếm nội dung trên Internet theo thời gian thực. Hai điểm này cũng là cơ sở để xây dựng cơ sở dữ liệu chỉ mục tự xây dựng, đòi hỏi phải sử dụng tìm kiếm vectơ, lập chỉ mục thời gian thực, phân tích dữ liệu thời gian thực và các công nghệ khác.
Làm thế nào OpenAI có được những khả năng kỹ thuật này? Điều này phải kể đến “bước đi lớn” gần đây của họ.
Vào tháng 6 năm nay, OpenAI đã mua lại công ty cơ sở dữ liệu phân tích thời gian thực Rockset với giá 500 triệu USD, giao dịch lớn nhất trong lịch sử của OpenAI. Rockset là cơ sở dữ liệu được lập chỉ mục đầy đủ theo thời gian thực , nổi tiếng với các chức năng truy vấn và lập chỉ mục theo thời gian thực , các dịch vụ của nó chủ yếu nhắm vào các kịch bản ứng dụng yêu cầu xử lý và truy vấn lượng lớn dữ liệu theo thời gian thực, chẳng hạn như bảng điều khiển thời gian thực. chỉ mục tìm kiếm, phân tích dữ liệu trực tuyến, v.v.
Trang web chính thức của Rockset, nguồn ảnh: Rockset
Rockset có một hệ thống lưu trữ khóa-giá trị có tên RocksDB , được phát triển bởi Venkat Venkataramani và Dhruba Borthakur, hai đồng sáng lập trước đây từng làm việc tại Facebook. Nó đặc biệt tốt ở khả năng đọc và viết nhanh, do đó cho phép người dùng đọc và viết. trong mili giây. Truy vấn và phân tích các tập dữ liệu quy mô lớn.
Thông qua việc truyền dữ liệu trực tuyến, lập chỉ mục tự động, tối ưu hóa bộ nhớ, truy vấn đồng thời cao và các công nghệ khác, Rockset có thể cải thiện đáng kể tốc độ phản hồi của SearchGPT đối với các yêu cầu của người dùng, đảm bảo "độ bền" của các sản phẩm tìm kiếm AI.
Ngoài việc “nhanh”, Rockset còn có thể đảm bảo tính “ổn định” của các sản phẩm tìm kiếm AI, tức là có nhiều vòng hỏi đáp tương tác.
Là cơ sở dữ liệu được lập chỉ mục đầy đủ theo thời gian thực, Rockset có thể cung cấp dữ liệu toàn diện và đầy đủ hơn, đồng thời hỗ trợ các truy vấn đa chiều, có nghĩa là người dùng có thể lọc kết quả dựa trên các thuộc tính và điều kiện khác nhau, thông qua các công nghệ như lập chỉ mục theo ngữ cảnh và truy vấn SQL; , Rockset Điều này cho phép các sản phẩm tìm kiếm AI lưu trữ và truy xuất trạng thái ngữ cảnh tốt hơn, duy trì tính liên tục của phiên và cải thiện trải nghiệm Hỏi & Đáp tương tác nhiều vòng của các sản phẩm tìm kiếm AI.
Chức năng đặt câu hỏi của SearchGPT, nguồn video: OpenAI
Trước khi OpenAI mua lại Rockset, khi giải quyết dữ liệu vấn đề về lập chỉ mục, truy vấn và lưu trữ dữ liệu của các mô hình lớn, giải pháp phổ biến trong ngành là thêm một "plug-in" vào mô hình lớn, hay còn gọi là "cơ sở dữ liệu vectơ". Trong năm qua, cơ sở dữ liệu vectơ đã trở nên phổ biến trên toàn quốc và hầu hết mọi nhà sản xuất cơ sở dữ liệu vectơ đều đang tiếp thị với "bộ nhớ của các mô hình lớn" như một điểm bán hàng. Rockset không chỉ có thể lập chỉ mục vectơ mà còn lập chỉ mục các dạng dữ liệu khác nhau như lập chỉ mục từ khóa và lập chỉ dữ liệu , có thể cung cấp kết quả tìm kiếm chất lượng cao hơn và đáp ứng các nhu cầu truy vấn đa dạng.
Đây cũng là một công nghệ cốt lõi khác của Rockset bên cạnh RocksDB - Hybrid Search. Đây là phương pháp tìm kiếm đa diện (tích hợp tìm kiếm vectơ, tìm kiếm văn bản và lọc dữ liệu, v.v.) linh hoạt và cho phép lập chỉ mục và sử dụng nhiều loại dữ liệu, bao gồm cả dữ liệu thời gian thực và do đó thường được sử dụng theo ngữ cảnh. Đề xuất sản phẩm, tổng hợp nội dung được cá nhân hóa và các tình huống khác. Công nghệ này đóng vai trò quan trọng trong New Bing của Microsoft và Tổng quan về AI của Google.
Chính nhờ khả năng kỹ thuật "tìm kiếm kết hợp" này mà SearchGPT có điểm nổi bật thứ ba - đa phương thức. Nó không chỉ cung cấp phiên bản văn bản của câu trả lời mà còn bổ sung thêm nhiều chiều nội dung ở cấp độ hiển thị kết quả, bao gồm dữ liệu, danh sách, hình ảnh và video, v.v., nâng cao tính phong phú và dễ hiểu của thông tin.
Ví dụ: khi một cư dân mạng tư cách thử nghiệm hỏi về điều kiện thời tiết ở London, SearchGPT đã trực tiếp đưa ra dự báo thời tiết trong bảy ngày tới, bao gồm các biểu tượng thời tiết và các tiện ích khác.
Nguồn hình ảnh: X @Kesku
Cư dân mạng cũng hỏi SearchGPT đâu là thời gian và địa điểm tốt nhất cho chuyến dã ngoại ở London. Mặc dù nó đưa ra một số lựa chọn về công viên nhưng nó cũng liệt kê một số bức ảnh về London trong các điều kiện thời tiết khác nhau ở bên trái.
Nguồn hình ảnh: X @Kesku
Về mặt di động của SearchGPT, hiệu suất đa phương thức của các câu trả lời của nó cũng rất tốt: ví dụ: tìm kiếm cổ phiếu của Nvidia sẽ đưa ra biểu đồ xu hướng chứng khoán; ví dụ khác, tìm kiếm một bài hát, SearchGPT sẽ trực tiếp đưa ra một video Youtube; , mà người dùng không cần phải nhấp vào nó. Trang web có thể được phát.
Nguồn hình ảnh: X @Kesku
Tại sao trình bày đa phương thức lại quan trọng? Điều này chủ yếu là do phần lớn các sản phẩm tìm kiếm AI hiện tại vẫn đưa ra câu trả lời bằng văn bản. Mặc dù trả lời bằng văn bản có thể giải quyết hầu hết các vấn đề của người dùng, nhưng trong hoàn cảnh cạnh tranh có nhiều người tham gia và đồng nhất hơn, bất kỳ ai có thể cung cấp các câu trả lời nhiều chiều hơn và phong phú hơn đều có thể nắm vững giai đoạn tiếp theo của tìm kiếm AI.
Truy xuất đa phương thức không chỉ hữu ích cho người dùng hiểu nội dung tìm kiếm một cách trực quan hơn và cải thiện trải nghiệm tìm kiếm mà còn mang lại lợi ích to lớn cho việc lặp lại sản phẩm - Các sản phẩm tìm kiếm AI được trang bị mô hình đa phương thức có thể xử lý văn bản, hình ảnh và âm thanh tại đồng thời, video và các loại dữ liệu khác nhau, thu được kiến thức và bối cảnh toàn diện hơn từ thông tin đa dạng, điều này rất quan trọng để hiểu và thực hiện nhiệm vụ phức tạp thông qua học tập đa phương thức, các sản phẩm tìm kiếm AI và các mô hình đằng sau chúng cũng có thể; Khái quát hóa tốt hơn cho các tình huống chưa được nhìn thấy, cải thiện độ chính xác, khả năng thích ứng và tính hữu ích của kết quả tìm kiếm.
Việc trình bày kết quả tìm kiếm theo nhiều phương thức chủ yếu đến từ sự hỗ trợ của các khả năng của mô hình. Về cơ bản, các nhà sản xuất có khả năng long cũng có khả năng tạo ra các sản phẩm tìm kiếm AI đa phương thức. Đây cũng là lý do tại sao một số lượng đáng kể các sản phẩm tìm kiếm AI đa phương thức đến từ các nhà sản xuất lớn - chẳng hạn như 360. Tìm kiếm AI do 360 Group ra mắt. Nó hỗ trợ người dùng đặt câu hỏi bằng cách chụp ảnh, đồng thời hỗ trợ tìm kiếm tài liệu, hình ảnh, âm thanh và video; Tìm kiếm AI Tiangong do Kunlun Wanwei ra mắt không chỉ hỗ trợ nhận dạng hình ảnh AI, tạo hình ảnh AI. , v.v., nhưng cũng hỗ trợ thu thập, viết, đọc, trò chuyện và nói. Nó có các khả năng đa phương thức như nói, nghe và hát, đồng thời tạo ra bản đồ tư duy và phác thảo Genspark, sản phẩm tìm kiếm AI được tạo bởi; Cựu CEO của Xiaodu, Jing Kun, cũng có thể tạo ra các biểu đồ và hình ảnh trực quan dựa trên câu hỏi của người dùng.
Kết quả tìm kiếm 360 AI, nguồn hình ảnh: tìm kiếm 360 AI
Kết quả tìm kiếm Tiangong AI, nguồn ảnh: Tiangong AI
Kết quả tìm kiếm Genspark, hình ảnh được ghép bởi "Jiazi Guannian"
Là một trong những công ty mô hình quy mô lớn hùng mạnh nhất thế giới, khả năng xử lý đa phương thức của mô hình OpenAI đương nhiên không thể không nhắc tới.
Trong bản demo do SearchGPT phát hành lần, một chức năng có tên "Câu trả lời trực quan" đã được hiển thị, nhưng OpenAI không giải thích chi tiết nguyên tắc hoạt động của nó.
Nguồn hình ảnh: OpenAI
Như đã đề cập trước đó, TestCatalog News đã phát hiện ra mã nguồn của SearchGPT. Mã nguồn này không chỉ hiển thị giao diện Bing mà còn phát hiện ra rằng kết quả tìm kiếm được hỗ trợ bởi các mô hình đa phương thức. Mặc dù không thể nhìn thấy mô hình cụ thể và quy trình xử lý của nó, nhưng mô hình đa phương thức phải có chức năng tự động hiểu hình ảnh.
Nguồn hình ảnh: X @TestingCatalog News
Zhu Jie, kiến trúc sư trưởng sản phẩm của bộ phận cơ sở dữ liệu của Baidu, cho rằng rằng nếu SearchGPT muốn tạo ra trải nghiệm khác biệt với các sản phẩm như Perplexity và đạt được mục tiêu vượt lên với tư cách là người đi sau, thì điểm thu hút lớn nhất là "đa phương thức". Rockset đã cung cấp khả năng truy xuất dữ liệu đa phương thức. Nếu bạn có thể dựa vào các mô hình lớn đa phương thức để thực hiện nhiều "công việc ưa thích" hơn về mặt tương tác, thì tăng trưởng người dùng sẽ nhanh hơn.
Nói tóm lại, khả năng tìm kiếm kết hợp của Rockset, cùng với sự hỗ trợ mô hình lớn đa phương thức của OpenAI, cho phép SearchGPT cung cấp trải nghiệm tương tác tốt hơn và đây cũng là mục đích ban đầu của việc OpenAI mua lại Rockset.
Trong thông báo về việc mua lại Rockset, OpenAI đã viết: "AI có cơ hội thay đổi cách mọi người và tổ chức tận dụng dữ liệu của chính họ... Chúng tôi sẽ tích hợp công nghệ của Rockset để cung cấp năng lượng cho cơ sở hạ tầng truy xuất của chúng tôi trên các sản phẩm và các thành viên đẳng cấp thế giới của Rockset đội ngũ dữ liệu tham gia OpenAI. .)
Thông báo OpenAI mua lại Rockset, nguồn ảnh: OpenAI
OpenAI cho biết họ hy vọng mua lại Rockset để cung cấp hỗ trợ cho cơ sở hạ tầng truy xuất sản phẩm chéo của riêng mình. Có thể thấy rằng việc truy cập và xử lý dữ liệu thời gian thực đã trở thành một phần quan trọng trong cuộc chạy đua vũ trang AI hiện nay. Một số người trong ngành chỉ ra rằng việc mua lại này về cơ bản cho thấy cơ sở dữ liệu vectơ không thể thực sự giải quyết được vấn đề "bộ nhớ trí tuệ nhân tạo (bộ nhớ)". Ngược lại, cơ sở dữ liệu thời gian thực nói chung có thể làm được điều đó . OpenAI, nhận thức được điều này, cũng đang cố gắng xây dựng một "cơ sở dữ liệu phổ quát" vững chắc cho từng mô hình lớn bên trong của mình, từ đó giảm ảo giác về các mô hình lớn và cải thiện tính chính xác, kịp thời và phù hợp theo ngữ cảnh của nội dung do AI tạo ra.
Việc mua lại Rockset là một bước cực kỳ quan trọng trước khi OpenAI ra mắt SearchGPT. Nó bổ sung những thiếu sót dữ liệu của OpenAI, cải thiện hiệu quả và tốc độ rút , xử lý và phân tích dữ liệu của OpenAI, đồng thời cho phép OpenAI liên tục rút và lập chỉ mục từ nhiều nguồn dữ liệu khác nhau. Có thể nói, Rockset không chỉ giúp OpenAI giảm độ trễ của các sản phẩm tìm kiếm AI và cho phép SearchGPT đưa ra câu trả lời “nhanh hơn” mà còn giúp xây dựng thư viện chỉ mục hiệu quả, đầy đủ và cập nhật theo thời gian thực, cải thiện hơn nữa khả năng tìm kiếm AI. Tính kịp thời và chính xác của câu trả lời về sản phẩm.
3.SearchGPT, tại sao lại là bây giờ?
Tại sao nên khởi chạy SearchGPT ngay bây giờ? Điều này có thể liên quan đến những khó khăn tài chính mà OpenAI gặp phải.
Trong một báo cáo gần đây của The Information, người ta đã đề cập rằng tính đến tháng 3 năm nay, chi phí suy luận của OpenAI (chi phí thuê máy chủ của Microsoft) đã lên tới 4 tỷ USD và chi phí đào tạo có thể tăng vọt lên 3 tỷ USD trong năm nay, cộng thêm 1,5 tỷ USD chi phí. chi phí lao động, do đó, chi phí vận hành doanh nghiệp của OpenAI năm nay vào khoảng 8,5 tỷ USD.
Về mặt thu nhập, mặc dù tổng thu nhập hàng tháng gần đây của OpenAI là 283 triệu USD, nhưng thu nhập cả năm cũng có thể đạt 3,5 tỷ-4,5 tỷ USD (theo ước tính của FutureSearch, thu nhập định kỳ hàng năm của OpenAI vào năm 2024 là khoảng 3,4 tỷ USD, tương đương ), nhưng liệu nó có thể đạt được con số này hay không còn phụ thuộc vào doanh số bán hàng trong nửa cuối năm nay.
Nói cách khác, ngay cả khi OpenAI cố gắng hết sức để đạt doanh thu cả năm là 3,5 tỷ USD, họ vẫn sẽ lỗ vốn khoảng 5 tỷ USD trên sổ sách.
Điều này buộc OpenAI phải cố gắng hết sức để tìm cách kiếm tiền. Trong cơ cấu doanh thu của OpenAI, phần lớn thu nhập vẫn do C-side đóng góp - 55% doanh thu đến từ các thuê bao trả phí mua ChatGPT Plus (khoảng 7,7 triệu) và 45% doanh thu còn lại đến từ phiên bản ChatGPT dành cho doanh nghiệp (. 21%), thu nhập API (15%) và phiên bản đội ngũ ChatGPT (8%). Do đó, bắt đầu từ các nguyên tắc cơ bản C-end mạnh mẽ là chìa khóa để OpenAI đạt được bước đột phá về doanh thu.
Nguồn hình ảnh: FutureSearch
Trong kịch bản bên C, tìm kiếm là một trong những mô hình kinh doanh có giá trị nhất. Tìm kiếm, như một kịch bản tự nhiên với số lượng lớn người dùng, đã từng là nguồn truy cập số một về phía PC. Baidu dựa vào tìm kiếm để đạt được địa vị của mình trên thế giới và Google cũng dựa vào tìm kiếm để trở thành một trong những công ty Internet. với giá trị vốn hóa thị trường cao nhất thế giới. Vào năm 2023, công ty mẹ Alphabet có doanh thu 370,394 tỷ USD, doanh thu 175,033 tỷ USD được đóng góp bởi việc kinh doanh tìm kiếm của Google (chiếm khoảng 47,26% tổng doanh thu).
Nguồn ảnh: Báo cáo thường niên 2023 của Alphabet
Mặc dù số lượng người dùng hoạt động hàng ngày của ChatGPT vẫn ở mức khoảng 50 triệu, nhưng nó vẫn là ứng dụng sát thủ duy nhất trong lĩnh vực AI tổng hợp. Tuy nhiên, nó vẫn còn kém xa Facebook, Youtube, Instagram, v.v. trong kỷ nguyên Internet.
Li Guanmi, Giám đốc điều hành của Shixiang Technology, cho biết trong một cuộc phỏng vấn vào tháng 4 năm nay: “Nếu là tôi, trước tiên tôi sẽ tăng ChatGPT từ 50 triệu DAU lên 300 triệu… vì ChatGPT hiện có ít hơn 10 triệu người dùng trả phí. Nếu Đạt được 30 triệu người dùng trả phí có nghĩa là thu nhập đăng ký hàng năm là 6 tỷ USD, có thể hỗ trợ khoản đầu tư hàng năm của AGI một cách tương đối lành mạnh.”
Tìm kiếm là một thị trường trị giá 200 tỷ USD. Quy mô thị trường hiện tại của cái gọi là "sản phẩm tìm kiếm gốc AI" chỉ là vài tỷ đô la và vẫn còn rất nhiều chỗ cần lấp đầy. Sau khi chức năng tìm kiếm được giới thiệu cho ChatGPT, ChatGPT có thể tạo ra nhiều mô hình kinh doanh hơn như quảng cáo và đề xuất bên cạnh hệ thống đăng ký và mở rộng thêm nguồn doanh thu.
Ngoài việc sử dụng tìm kiếm để tăng lưu lượng truy cập và doanh thu, việc tận dụng khoảng thời gian do chi phí suy luận giảm mang lại có thể là lý do thứ hai khiến OpenAI chọn khởi chạy SearchGPT vào thời điểm này.
Doanh thu từ các sản phẩm tìm kiếm không đến trực tiếp từ người dùng C-end mà từ người dùng B-end mang lại sau khi người dùng C-end tích lũy đến một số tiền nhất định. Do đó, trước khi các sản phẩm tìm kiếm có thể đạt được dòng tiền dương, chúng không chỉ có chu kỳ vận hành và thu hút người dùng dài mà còn có chi phí xây dựng và bảo trì sản phẩm và công nghệ đáng kể.
Lấy các công cụ tìm kiếm truyền thống làm ví dụ: Theo báo cáo của Morgan Stanley, Google sẽ có khoảng lần nghìn tỷ lượt tìm kiếm vào năm 2022, với chi phí trung bình lần lượt tìm kiếm là khoảng 0,2 xu. Về thu nhập, theo dữ liệu được Chủ tịch Kunlun Wanwei Fang Han tiết lộ trong một podcast, thu nhập quảng cáo tìm kiếm của Google vào năm 2023 sẽ xấp xỉ 160 tỷ USD. Dựa trên tính toán này, thu nhập do một tìm kiếm tạo ra là khoảng 5 xu.
Vậy tìm kiếm AI có giá bao nhiêu? Từ bài viết trước, chúng ta có thể biết rằng tìm kiếm AI bổ sung khả năng của các mô hình lớn cho công cụ tìm kiếm truyền thống. Do đó, chi phí tìm kiếm AI dựa trên 0,2 xu ban đầu và phép tính được tạo ra bằng cách gọi mô hình lớn cũng được thêm vào. Tỷ lệ băm, mức tiêu thụ điện năng và đầu tư phần cứng, chi phí cho một lần tìm kiếm AI cao gấp khoảng 10 lần so với một công cụ tìm kiếm truyền thống, tức là 2 xu.
Kể từ tháng 5 năm nay, với sự cải thiện về hiệu suất phần cứng, tối ưu hóa thuật toán và đổi mới kiến trúc kỹ thuật, chi phí suy luận của các mô hình lớn đã liên tục giảm: ví dụ, mô hình phiên bản Deepseek-V2 do Magic Square Quantification phát hành sử dụng kiến trúc MLA cải tiến, giảm mức sử dụng bộ nhớ xuống còn 5%-13% so với trước đây và kiến trúc DeepSeekMoESparse ban đầu của nó giảm lượng tính toán đến mức tối đa, tất cả đều giúp giảm chi phí suy luận mô hình, một ví dụ khác là chính OpenAI, chúng có trong 7 GPT-; 4o mini được phát hành vào ngày 19 tháng 3 bằng cách cải thiện cấu trúc mô hình và tối ưu hóa dữ liệu và quy trình đào tạo, GPT-4o mini đạt được hiệu suất gần bằng GPT-4, nhưng chi phí rẻ hơn 60% so với GPT-3.5 Turbo. text-davinci-003 phiên bản GPT-3 hai năm trước, chi phí đã giảm 99%.
Khi chi phí suy luận mô hình lớn tiếp tục giảm, việc ra mắt SearchGPT vào thời điểm này không chỉ mang lại lợi thế về chi phí gọi mô hình mà còn có thể giảm thêm chi phí cho lần tìm kiếm với sự trợ giúp của số lượng người dùng tăng trưởng .
4. Đừng chỉ tìm kiếm bất kể thế nào.
Nếu OpenAI thực sự coi SearchGPT là bước quan trọng thu hút người dùng và đột phá thương mại hóa, thì làm thế nào SearchGPT có thể tạo ra những đột phá về sản phẩm để có cơ hội trở thành “đột phá lưu lượng” của OpenAI, thu hút nhiều người dùng hàng ngày hơn và đạt được chuyển đổi tốt hơn?
"Jiazi Guannian"cho rằng có hai hướng:
Đầu tiên là UGC+AIGC và thứ hai là quy trình làm việc tự động .
Hãy nói về cái đầu tiên trước. Chúng tôi đã đề cập trước đó rằng rào cản lớn nhất đối với tìm kiếm AI là dữ liệu, tức là nội dung. Bối cảnh nội dung Internet của Trung Quốc đã được chia thành nhiều phe khác nhau như Baidu, WeChat, Zhihu, Xiaohongshu, Taobao, v.v., và chúng khá bị chia rẽ với nhau. So với Trung Quốc, hệ sinh thái Internet nước ngoài cởi mở hơn, luồng dữ liệu và chia sẻ giữa các trại nội dung khác nhau diễn ra thường xuyên hơn.
Do đó, một số sản phẩm tìm kiếm AI ở nước ngoài đã nắm bắt cơ hội này và bắt đầu khám phá phương pháp tạo nội dung AIGC+UGC nhằm cố gắng làm phong phú hệ sinh thái nội dung của riêng họ. Các đại diện tiêu biểu là Perplexity và Genspark.
Perplexity đã ra mắt tính năng Trang, cho phép người dùng tạo nội dung trực tiếp trên nền tảng Perplexity. Người dùng không chỉ có thể chuyển đổi các câu trả lời thu được từ tìm kiếm ban đầu thành "Trang" dưới dạng bài viết mà còn có thể nhập trực tiếp các từ truy vấn và Perplexity sẽ tìm kiếm các bài viết hoặc báo cáo công khai để trực tiếp tạo Trang. Không chỉ vậy, Perplexity còn có thể viết lại, định dạng hoặc xóa Trang theo nhu cầu của người dùng hoặc chèn hình ảnh, video liên quan.
Nguồn ảnh: Lúng túng
Genspark, được thành lập bởi Jing Kun, cựu CEO của Xiaodu Technology, cũng không ngoại lệ.
Trên ProductHunt, Genspark tự mô tả mình là: “Một công cụ tác nhân AI trong đó các tác nhân AI chuyên dụng tiến hành nghiên cứu và tạo các trang tùy chỉnh được gọi là Sparkpages là nội dung không thiên vị và hướng đến SEO tổng hợp thông tin đáng tin cậy, Cung cấp kết quả có giá trị hơn và tiết kiệm thời gian cho người dùng”.
Sparkpages là cốt lõi của Genspark: sau khi người dùng tìm kiếm câu hỏi, Genspark không chỉ đưa ra câu trả lời đầu tiên như các sản phẩm tìm kiếm AI khác mà còn tạo ra một trang chủ đề bằng cách tích hợp các kết quả tìm kiếm này. Nó sẽ hiển thị văn bản, hình ảnh, video, v.v. liên quan đến chủ đề tìm kiếm một cách có cấu trúc và trình bày nó cho người dùng theo dòng thác nước.
Nguồn hình ảnh: Genspark
Sparkpage không chỉ cho phép người dùng truy cập thông tin nhanh chóng và hiệu quả hơn thông qua hình thức "các trang web tổng hợp thông tin" mà còn cho phép người dùng sao chép và chỉnh sửa các trang được tạo: có nút " Copy and Create My Plan " ở phía trên bên phải ở mỗi góc của Sparkpage, sau khi nhấn sẽ mở ra một trang chỉnh sửa đã sao chép nội dung của Sparkpage. Người dùng có thể đặt câu hỏi theo ngữ cảnh ở cột Copilot bên phải về Context Pool ở bên trái, gọi tìm kiếm bên ngoài để có câu trả lời. , đồng thời, nội dung trong Copilot có thể được Sao chép vào Sparkpage ở bên trái chỉ bằng một cú nhấp chuột. Giống như các trang của Perplexity, Sparkpage cũng có thể được lập chỉ mục bởi công cụ tìm kiếm SEO.
Cấp dưới cũ của Jing Kun và người hành nghề AI Liu Jia (bút danh) nói với "Jiazi Guannian" rằng khi Jing Kun vẫn còn làm việc tại Xiaodu, anh ấy lần đề cập đến sự cần thiết phải "xây dựng lại hệ sinh thái nội dung đằng sau tìm kiếm", vì vậy Genspark đã thực hiện bước này “. Mô hình AIGC+UGC” không có gì bất ngờ.
"Rào cản lớn nhất đối với tìm kiếm AI hiện nay là chất lượng của các nguồn thông tin đằng sau nó. Ưu điểm của Genspark là nó có thể đáp ứng nhu cầu tìm kiếm trong thời gian ngắn thông qua các nguồn thông tin chất lượng cao + sự hiểu biết về AI, sau đó tạo ra các kết cấu có cấu trúc chất lượng cao." trang tóm tắt Sparkpage. Những nội dung này Dữ liệu được đưa vào lại bởi tìm kiếm, tương đương với nội dung "tự sản xuất và tự bán" của các sản phẩm tìm kiếm AI. Giả sử rằng bánh đà này có thể quay, về mặt lý thuyết, càng có nhiều người dùng sử dụng nó. Càng có nhiều nội dung chất lượng cao thì càng có nhiều rào cản nội dung được dựng lên đằng sau việc tìm kiếm", Liu Jia nói.
Đánh giá của Liu Jia về Genspark trên mạng xã hội, nguồn ảnh: Jiji
Mặc dù SearchGPT đã làm rất tốt nội dung AIGC, với giao diện đơn giản, trải nghiệm người dùng thoải mái và nguồn thông tin chất lượng cao, nhưng nó vẫn chưa đủ trong UGC. Tôi tự hỏi liệu tính năng này có xuất hiện trong các phiên bản chính thức tiếp theo hay không.
Việc triển khai “quy trình làm việc tự động” của các sản phẩm tìm kiếm AI chủ yếu dựa vào Agent, đặc biệt là khả năng multi-Agent. Sự khác biệt lớn nhất giữa công cụ tìm kiếm AI và công cụ tìm kiếm truyền thống là chúng không chỉ có thể tóm tắt và phân loại kết quả tìm kiếm mà còn có thể thực hiện các hành động khác, chẳng hạn như tạo bản đồ tư duy, tạo PPT, lập kế hoạch công việc và cuộc sống, v.v. . Tất cả các khả năng đằng sau điều này đều phụ thuộc vào Tác nhân.
Trên thực tế, hầu hết các sản phẩm tìm kiếm AI hiện nay đều đã bổ sung thêm khả năng của AI Agent. Những bài thuyết trình “vui tươi” về thu thập dữ liệu về cơ bản đều được thực hiện bởi plug-in Agent, chẳng hạn như Q&A phân tích tài liệu tìm kiếm 360 AI và phân tích nội dung trang web. , chức năng phân tích và tóm tắt âm thanh và video, đồng thời tạo bản đồ tư duy, chức năng tìm kiếm bản đồ tư duy của Secret Tower AI, sắp xếp những người và sự kiện liên quan khác nhau cũng như chức năng tìm kiếm các bài báo học thuật và podcast, tìm kiếm Tiangong AI. tài liệu + phân tích âm thanh và video cũng như nhạc AI , AI PPT và các chức năng khác;
Công cụ tìm kiếm B2B AI mới ra mắt gần đây của Alibaba International dường như có khả năng AI Agent đằng sau nó. Nó có thể chủ động hiểu ngôn ngữ tự nhiên của người mua và chuyển nó thành các yêu cầu mua hàng chuyên nghiệp. Hơn nữa, nó cũng có thể dự đoán nhu cầu và đưa ra đề xuất dựa trên dữ liệu thị trường toàn cầu để đạt được sự kết hợp chính xác hơn. Chỉ cần người dùng hỏi bằng "bản ngữ" trong công cụ tìm kiếm AI mới, nó sẽ hiểu chính xác hơn nhu cầu của người dùng thông qua đối thoại với người dùng, đề xuất nhiều phương án cho người dùng, đồng thời chủ động so sánh và tóm tắt ưu và nhược điểm, cuối cùng giúp ích người dùng Hoàn thành các giao dịch và thực hiện việc giao hàng.
Alibaba International công bố ra mắt công cụ tìm kiếm B2B dựa trên AI đầu tiên trên thế giới tại Paris, Pháp. Nguồn ảnh: Alibaba International.
Tuy nhiên, về mặt sử dụng chung của nhiều tác nhân, hiện tại có tương đối ít sản phẩm tìm kiếm AI có thể làm được điều này. Chỉ có những sản phẩm như Bocha AI Search và Genspark đang thử nghiệm.
Ví dụ: Bocha AI Search đã đi tiên phong trong mô hình tìm kiếm đa tác nhân (Tìm kiếm tác nhân) + tìm kiếm đa phương thức (Tìm kiếm phương thức), giới thiệu các tác nhân AI và nội dung UGC chất lượng cao, sẽ xác định nhu cầu tìm kiếm của người dùng và phù hợp với các tác nhân tương ứng. trả lời câu hỏi, nó cũng hỗ trợ tìm kiếm các trang web, phim truyền hình ngắn, video, hình ảnh, v.v.
Kiến trúc tổng thể của tìm kiếm AI của Bocha được phát triển dựa trên nền tảng nhà phát triển Byte Coze (Coze) và nó đã hợp tác với Coze để mở kênh phát hành đại lý. Trong tương lai, các tác nhân do nhà phát triển tạo ra có thể được phát hành trực tiếp cho Bocha, không chỉ có thể cung cấp cho mọi người nhiều nội dung tìm kiếm phong phú hơn mà còn có thể cung cấp lưu lượng truy cập được nhắm mục tiêu cho các đại lý của nhà phát triển.
Genspark cũng sử dụng khung đa tác nhân, mỗi khung có thể cung cấp dịch vụ chuyên nghiệp cho các loại truy vấn cụ thể để đảm bảo tính chính xác và mức độ liên quan của kết quả tìm kiếm. Một blogger đã phân tích quá trình tìm kiếm của Genspark và nhận thấy rằng trong lần quá trình tìm kiếm, Genspark gọi ít nhất 6 AI Agent và các mô hình lớn từ 4-14 lần.
Nguồn ảnh: Sản phẩm AI Rena
Các Đại lý được đề cập ở trên là một quy trình làm việc tự động sử dụng Đại lý, tập trung nhiều hơn vào tìm kiếm chung; về mặt tìm kiếm theo chiều dọc, Genspark cũng sử dụng ba Đại lý để xử lý ý định tìm kiếm của người dùng về du lịch, sản phẩm và hình ảnh.
Nguồn hình ảnh: Genspark
Người dùng không chỉ có thể nhấn nhãn tương ứng để vào trang Đại lý cụ thể mà còn có nhấn hộp nhập để chọn Đại lý tương ứng và nhập tìm kiếm Đại lý được nhắm mục tiêu.
Nguồn hình ảnh: Genspark
Trong Hội nghị An ninh Internet lần thứ 12, Chu Hongyi nói với "Jiazi Guannian" rằng điều quan trọng nhất của Agent là giải quyết vấn đề mà các mô hình lớn không thể "suy nghĩ chậm" là không thể thiếu trong các sản phẩm tìm kiếm AI.
"Bộ não con người có hai cách suy nghĩ: suy nghĩ nhanh và suy nghĩ chậm. Mô hình lớn phổ biến nhất là suy nghĩ nhanh . Khi được hỏi 2+2 bằng bao nhiêu thì nó buột miệng nói ra. Nhưng khi gặp những vấn đề thực sự phức tạp, chẳng hạn như viết một tờ báo hoặc làm công việc phân tích, con người cần phải có tư duy Chậm , đồng thời cần huy động các kỹ năng lập kế hoạch, phản xạ, suy luận logic, tốc độ chậm nhưng độ chính xác cao. Các mô hình lớn hiện chỉ có khả năng tư duy nhanh chứ chưa có khả năng tư duy chậm. Chúng tôi đề xuất sử dụng khung Tác nhân để xây dựng hệ thống tư duy chậm thông qua kiến thức và công cụ, nâng cao khả năng lập kế hoạch cho các mô hình lớn và xây dựng khả năng tư duy chậm về các mô hình lớn,” Chu Hongyi nói.
Tuy nhiên, có lẽ vì nó vẫn đang trong giai đoạn nguyên mẫu sản phẩm nên hiện tại chúng tôi chưa thấy khả năng "đa tác nhân" trong SearchGPT. Tuy nhiên, vì SearchGPT được tích hợp vào ChatGPT, OpenAI có thể tích hợp nó với trí thông minh trong GPT Store trong. tương lai (GPT) và hợp lực để cung cấp dịch vụ cho người dùng.
Ngoài ra, Zhou Hongyi cũng nhấn mạnh rằng khi các công ty mô hình lớn tạo ra sản phẩm AI, họ phải chú ý đến việc "tích hợp với các kịch bản" để đạt được trải nghiệm người dùng tốt nhất. Việc OpenAI ra mắt sản phẩm tìm kiếm cũng đồng nghĩa với việc OpenAI ngày càng chú ý hơn đến tầm quan trọng của các “kịch bản”.
Như người sáng lập a16z Marc Andresson đã khuyên người sáng lập Perplexity Aravind Srinivas, "Đừng chỉ tìm kiếm" - cho dù đó là UGC hay đa tác nhân, thì đó chỉ là Tìm kiếm "kỹ thuật" của một sản phẩm bằng cách tìm ra các tình huống sử dụng phù hợp của người dùng; bạn có thể "hợp nhất Đạo và ma thuật" và đạt được tăng trưởng.
* Tham khảo:
" Phân tích độ sâu về Sản phẩm Tìm kiếm AI - Phân tích Nguyên tắc Tìm kiếm và Mô hình Kinh doanh", sản phẩm AI Rena
"Đấm Google, đá Perplexity, Genspark muốn trở thành một phụ nữ xinh đẹp chuẩn bị cho bạn một bữa ăn ngon và cho vào miệng bạn!" “Loài mới”, sản phẩm AI Bác Hoàng
"Tôi đã xây dựng một công cụ tìm kiếm AI", Ai Doubi
“Tại sao OpenAI có thể lỗ 5 tỷ USD trong năm nay”, Thông tin
"Báo cáo doanh thu OpenAI", FutureSearch
"Zhang Peng nói chuyện với Fu Sheng và Fang Han: Cơ hội tìm kiếm AI ở đâu? Tại sao OpenAI không tham gia trò chơi? ”, AI Insider | AGI Insider Podcast
"360AI Search, công ty phát triển nhanh nhất ở Trung Quốc, đang