經歷了幾輪爆料後,AI搜索賽道終於迎來了一位“重要玩家”——SearchGPT,一個由OpenAI推出的AI驅動的搜索引擎。
早在今年4月,就有工程師爆料OpenAI內部正在評估自己的AI搜索產品SONIC-SNC(SearchGPT);5月初,OpenAI即將發佈搜索產品的消息更是在網上大面積傳播。然而,直到三個月後,OpenAI的SearchGPT才正式亮相。
SearchGPT的推出並不讓人意外,大家更關心的是,AI搜索到底行不行,有沒有搶奪傳統搜索引擎市場份額的機會?
OpenAI CEO薩姆·奧爾特曼(Sam Altman)對此似乎很有信心,他將SearchGPT稱之為“new prototype(新的產品原型)”,並直言“我們認為今天的搜索還有改進空間”。他還表示,跟“老派(old-school)”搜索引擎相比,全新的SearchGPT令自己驚喜,對自家新產品毫不吝惜溢美之詞的同時,也絲毫不給谷歌、Bing等競爭對手留面子。
SearchGPT,圖片來源:OpenAI
目前,AI搜索賽道競爭激烈,不僅有New Bing、Perplexity、You.com、Lepton Search、Genspark、Hebbia等優秀的海外產品,還有秘塔AI搜索、360 AI搜索、天工AI搜索、博查AI搜索、Reportify、Devv等發展勢頭迅猛的國內產品。
在談到SearchGPT時,360集團創始人周鴻禕告訴「甲子光年」:“OpenAI本來做的是ChatGPT,他們覺得聊天界面能夠解決一些問題,但現在不得不做一個平行的SearchGPT,作為新的用戶體驗和入口。到底是Search好用還是Chat好用我們暫時不知道,有可能會平分秋色,也有可能一個被另外一個取代掉,但這至少說明AI搜索是重要的場景入口,大家都不能錯過。 ”
都說AI搜索重要,但AI搜索面臨一個挑戰是商業模式到底如何建立。“成本如果很低,用廣告可以,但現在很難放廣告,廣告都不一定cover你每個單詞搜索的成本。”周鴻禕說,“不是所有用戶都願意付費的,這個需要探索。”
本文,「甲子光年」將拆解SearchGPT及相關AI搜索產品,分析AI搜索產品的壁壘、突破和未來。
1.AI搜索不是搜索
要理解OpenAI搜索產品的優勢,首先要理解AI搜索產品底層的運作原理。
目前市面上的AI搜索產品主要有三大類,分別是專門的AI搜索產品、傳統搜索引擎推出的加入了AI能力的產品和大模型廠商做的有搜索能力的產品。
第一類以Perplexity、秘塔AI搜索、Genspark為代表,第二類以New Bing、Google AI Overview為代表,第三類以Kimi、豆包、騰訊元寶為代表。OpenAI雖然也屬於大模型廠商,但是由於他們有了ChatGPT這一大模型產品,因此重新開發了專門的AI搜索產品,SearchGPT也因而歸屬於第一類。
AI搜索的底層原理其實可以用“RAG(Retrieval-augmented Generation,檢索增強生成)”來概括,涉及Retrieval和Generation兩個步驟。其中,大部分的“Retrieval(檢索)”是由傳統搜索引擎的API來完成的,少部分採用自建索引庫的形式;而AI搜索產品主要做的事情就是拿到結果後的“Generation(生成)”,用AI代替人工, 閱讀檢索內容, 總結歸納後給到用戶一個直接的答案。
當然,這背後的鏈路會更加複雜,包括問題改寫(Intent Detection)、檢索結果重排(Reranking)、獲取詳情內容(Read Content)等一些重要的環節,大模型在讀取檢索內容之後,還要對檢索結果做預處理、搜索解決方案展示等工作。AI搜索的整個過程會涉及對大模型的多次調用,比如360做一次AI搜索就要調用9次大模型。
AI搜索流程圖,圖片來源:AI產品Rena
360多專家協同(CoE)架構模型工作流程圖,圖片來源:「甲子光年」拍攝
但是總體來說,AI搜索產品仍然是基於成熟的搜索產品發展而來的,檢索步驟調用外部的API就能解決,上下文增強和總結和生成步驟也只需調用底層大模型的能力。換句話說,AI搜索產品相較於傳統的搜索產品,並不是在做技術層面的創新,更多是在做產品層面的創新。
這也是為什麼Perplexity稱自己為“答案引擎”的原因——作為一個從搜索API到底層大模型都直接“套殼”的產品,Perplexity並不提供直接的搜索能力,而是通過接入API獲取了搜索引擎檢索的內容之後,再通過GPT-4、Claude等大模型將答案進行總結,最終整理成固定的格式呈現給用戶,幫用戶省去了逐頁查看和總結的時間。
能用“套殼”做出30億美元的估值,可以說,“套殼之王”Perplexity的勝利,不是技術的勝利,而是技術之上產品封裝的勝利,是對用戶需求精準洞察後,快人一步出擊的勝利。
圖片來源:Perplexity
因此,AI搜索不是搜索,而是總結。AI搜索產品真正比拼的也不是底層的技術能力,而是技術之上,誰能提供更準確的答案、更快的響應速度、更智能化的用戶體驗。
其中,“準確”是最關鍵的一點。AI搜索最大的壁壘是數據,要想得到準確的答案,底層數據的質量和數量至關重要。只有底層數據庫足夠大、容納的信息足夠多、信息更新得足夠及時,才能保證大模型在內容獲取的時候“有據可依”,從而總結和輸出更準確、更有時效性的內容。這也是谷歌為什麼在搜索引擎領域常年保持90%以上市佔率的原因——他們從1998年成立的第一天起就開始做索引,擁有全世界最大、最全的索引庫,能夠提供最準確和及時的搜索結果。
因此,想要讓搜索結果變得更準確,自建索引庫是很重要的解決辦法。
目前,絕大多數AI搜索產品都只是接入了傳統搜索引擎的API,沒有重新做一套底層的搜索系統,只有少部分如秘塔AI搜索(播客和文庫板塊)、360AI搜索以及少數的垂直AI搜索引擎搭建了索引庫。這主要是由於接入傳統搜索引擎的API已經能解決95%的問題了,加之自建索引庫的成本非常高昂,需要大量的人力財力和時間,因此,如果自建的索引庫不能提供比Google和Bing的API更加優質的內容,就沒有必要自建索引庫。
AI搜索流程圖 圖片來源:ThinkAny創始人idoubi,AI產品黃叔編輯
自建索引庫的成本有多高呢?360副總裁梁志輝曾經在一次播客中表示,爬取5000萬網頁的成本大約在100萬-200萬人民幣左右,但是5000萬網頁對於搜索引擎來說是很小的一個數字,基本上做一個搜索引擎,起碼要爬取1000億的網頁;如果要索引全球網頁的話,基本上需要3000臺-1萬臺服務器提供支持。
也就是說,做一個最簡單的搜索引擎,起碼要有20億-40億元的預算,這還不包括PageRank(網頁排名)的服務器成本、終端廠商的保護費成本和人員成本。這對於任何一家中小型創業公司都是難以逾越的成本。
這也是為什麼目前搜索引擎只有谷歌、微軟、百度等幾家大廠在做的原因——做搜索引擎成本太高了,只有大廠才有充足的資金、人才和設備去做這件事。
而除了成本高昂,搜索技術和算法也是相當有壁壘的一件事。以谷歌引以為傲的排名算法為例,它考慮了數百個不同的因素,包括內容質量、用戶體驗、移動友好性、頁面加載速度、安全性等,不僅結構複雜,而且還會根據外界環境實時進行更新。據悉,谷歌平均每天發佈6次算法更新,每年高達2000次;而且算法保密度極高,谷歌公司內部都沒幾個人知道其搜索排名算法的全貌。
可以想見,在如此巨大的成本+超高的技術門檻下,中小搜索引擎/AI搜索公司想要自建面向全網索引庫的難度無異於愚公移山。
然而,這難得倒中小公司,卻難不倒OpenAI。
作為一家累計融資額超過200億美元、以高人才密度著稱的公司,OpenAI在“錢”和“人”上自然都是不缺的。因此,他們完全有能力自建索引庫。
那SearchGPT到底有沒有自建索引庫呢?
「甲子光年」詢問了一些工程師後,得到的普遍回答是:“以OpenAI的資金和人才體量,是有能力自建索引庫的,只是由於構建全網的索引庫太費時費力費錢,他們應該是構建了部分的索引庫,但是不會放棄接入外部搜索API,並且用爬蟲做實時搜索補充答案。”
科技媒體TestingCatalog News扒出了SearchGPT的源代碼,印證了這一猜測——他們發現,SearchGPT仍然接入了Bing索引庫的API,但是與當前ChatGPT提供的通用Bing搜索功能不同,SearchGPT更擅長提供實時信息。而這一點,主要是靠網絡爬蟲(Crawlers)實現的。
圖片來源:TestingCatalog News
OpenAI開發者頁面的聲明進一步印證了這一猜測。他們在開發者平臺的概述中寫道:“OpenAI使用網絡爬蟲和用戶代理為其產品執行操作,這些操作要麼是自動的,要麼是由用戶請求觸發的。”
圖片來源:OpenAI Platform
綜上,SearchGPT很有可能採用了“自建部分索引庫+接入Bing的API+實時網絡爬蟲”三者結合的技術路線,來確保搜索結果的準確和及時。
除了自建索引庫,OpenAI為自己的AI搜索產品建立起的另一道數據壁壘,是內容。
在SearchGPT的發佈頁面,OpenAI提到,他們致力於打造一個蓬勃的出版商和創作者生態系統,幫助用戶發現出版商網站和體驗,同時為搜索帶來更多選擇。
他們合作的媒體包括《大西洋月刊》、美聯社和Business Insider的母公司Axel Springer,也包括下轄《華爾街日報》《泰晤士報》《太陽報》的媒體巨頭News Corp。OpenAI試圖以推薦鏈接去交換爬取這些媒體內容的權益,同時表示,媒體和出版商們可以自行選擇內容來源在SearchGPT中的呈現方式。
與機構媒體等專業的信息提供內容商合作是OpenAI給競爭對手的有力一擊。由於付費牆和反爬蟲機制的存在,不少AI搜索產品是無法抓取到專業機構媒體提供的內容的,這也造成了AI搜索產品生成結果的不完整、體驗性不佳。而與媒體建立合作關係後,不少媒體的獨家報道都可以在SearchGPT裡搜索到,這無疑繁榮了SearchGPT的內容生態,保障了其用戶體驗。
除了完善底層數據和內容生態,與媒體建立合作關係也是OpenAI為了確保版權合規的深思熟慮之舉。
自ChatGPT推出以來,圍繞生成式AI產品的版權訴訟就絡繹不絕,比如《紐約時報》已經花費100萬美元起訴OpenAI和微軟,對沖基金Alden Global Capital 旗下的八家出版物集團(包括《紐約每日新聞》和《芝加哥論壇報》 )也對這兩家公司提起了訴訟。同為生成式AI產品的Perplexity也因為在搜索結果中使用了《福布斯》的一篇報道,但沒有準確註明來源,而收到了《福布斯》的律師函。
因此,與媒體、出版商建立一個良性合作的機制,不僅能獲取更多內容來源,還能規避掉很多不必要的版權糾紛,未來或許還有機會通過廣告盈利,是一個一舉三得的美事。
無論是自建索引庫,還是通過與媒體合作獲取獨家內容,都有助於SearchGPT獲取高質量的數據,建立起數據和內容壁壘,進而在已經硝煙瀰漫的AI搜索戰爭中獲得一定的後發優勢。
2.用低延遲和多模態重構用戶體驗
如果說自建索引庫和與媒體合作是OpenAI為自己建立起的第一道數據壁壘,那麼極低的延遲、多輪問答交互和多模態的結果呈現則是OpenAI為自己建立的第二道用戶體驗壁壘。
前文我們提到,AI搜索不是搜索,而是總結。AI技術本身解決的是“信息撮合”問題,用戶使用AI搜索的目的也不只是單純地獲取信息,而是“僱傭”產品滿足自己的需求。儘管大模型技術會在一定程度上強化原有的搜索能力,但想要做好一款AI搜索產品,除了信息層面之外,還要在用戶端進行發力,與用戶進行創意性地交互,讓信息端和交互端“雙輪滾動”起來,才能誕生現象級的AI搜索產品。
什麼樣的交互能帶來好的用戶體驗呢?
獨立開發者、ThinkAny創始人idoubi(艾逗筆)在其AI搜索引擎的萬字覆盤文章中提到:“做好 AI 搜索引擎,最重要的三點是準 / 快 / 穩,即回覆結果要準,響應速度要快,服務穩定性要高。”
前文中提到的自建索引庫和與媒體合作保證了“準”,那“快”和“穩”怎麼保證呢?
降低迴復的延遲、能進行多輪問答就很關鍵。
SearchGPT也確實做到了回覆低延遲。從演示視頻中我們可以看到,SearchGPT的響應速度堪稱迅速,從輸入問題到給出回答,幾乎只用了1—2秒。
SearchGPT的低延遲迴復,視頻來源:OpenAI
如果說官方視頻還有剪輯的嫌疑,那麼部分獲得體驗資格的網友放出的體驗視頻則消除了這一嫌疑。從視頻中我們發現,SearchGPT的響應速度確實很快,從提出問題到給出答案僅用了3秒。
SearchGPT實測視頻,視頻來源:X @Paul Covert
這種超高的“實時性”是怎麼實現的呢?有兩種方式:第一種是提前把數據爬好,embedding(嵌入)到向量數據庫裡面,第二種是實時搜索網絡上的內容。這兩點也是自建索引庫的基礎,需要用到向量搜索、實時索引、實時數據分析等技術。
OpenAI是怎麼獲得這些技術能力的呢?這就不得不提到他們最近的一個“大動作”。
今年6月,OpenAI以5億美元的價格收購了實時分析數據庫公司Rockset,這是OpenAI歷史上規模最大的一筆交易。Rockset是一個實時全索引數據庫,以其實時索引和查詢功能著稱,其服務主要針對那些需要對大量數據進行實時處理和查詢的應用場景,比如實時儀表板、搜索索引、流式數據分析等。
Rockset官網,圖片來源:Rockset
Rockset擁有一個名為RocksDB的鍵值存儲系統,它由之前同在Facebook工作過的兩位聯創Venkat Venkataramani和Dhruba Borthakur共同開發,特別擅長快速讀寫,也因此能讓用戶在毫秒級的時間內查詢和分析大規模的數據集。
通過流式數據攝取、自動索引、內存優化、高併發查詢等技術,Rockset可以極大提升SearchGPT對於用戶問詢的響應速度,確保了AI搜索產品的“快”。
除了“快”,Rockset也能保證AI搜索產品的“穩”,即多輪交互問答。
Rockset作為一個實時全索引數據庫,可以提供更全面、完整的數據,也支持多維度查詢,這意味著用戶可以根據不同的屬性和條件來篩選結果;此外,通過上下文索引、SQL查詢等技術,Rockset可以讓AI搜索產品更好地存儲和檢索上下文狀態,保持會話的連續性,提升AI搜索產品的多輪交互問答體驗。
SearchGPT的追問功能,視頻來源:OpenAI
在OpenAI收購Rockset之前,在解決大模型的數據索引、查詢和存儲問題時,業內通用的方案是給大模型加一個“外掛”,也就是所謂的“向量數據庫”。過去一年,向量數據庫火遍大江南北,幾乎每個向量數據庫廠商都在以“大模型的記憶”為賣點進行營銷。而Rockset不僅能做向量索引,還能做關鍵字索引、元數據索引等不同形態數據的索引,可以提供更高質量的搜索結果,同時滿足多樣化的查詢需求。
這也是Rockset在RocksDB之外的另一項核心技術——混合搜索(Hybrid Search)。這是一種多方面的搜索方法(整合了向量搜索、文本搜索和元數據過濾等),靈活性強,允許索引和使用多種類型的數據,包括實時數據,也因此經常被用於上下文相關的產品推薦、個性化內容聚合等場景。這項技術在微軟的New Bing和谷歌的AI Overview中發揮了重要作用。
也正是得益於這種“混合搜索”的技術能力,SearchGPT擁有了第三個亮點——多模態。它不僅能提供文字版本的答案,還在結果展示層面加入了多樣式的內容維度,包括數據、列表、圖片視頻等,提升了信息的豐富度與可理解性。
比如,有拿到測試資格的網友問它倫敦的天氣情況,SearchGPT直接給出了未來七天的天氣預報,包含天氣圖標等小組件。
圖片來源:X @Kesku
網友又問SearchGPT倫敦野餐的最佳時間和地點有什麼,它在給出若干公園選項的同時,還在左側列出了一些不同天氣下倫敦的照片。
圖片來源:X @Kesku
而在SearchGPT的移動端,其答案的多模態表現也很出色:比如查詢英偉達的股票會給出股票走勢圖;再比如搜索一首歌,SearchGPT會直接給出Youtube的視頻,用戶無需點開網頁即可播放。
圖片來源:X @Kesku
為什麼多模態的呈現結果這麼重要?這主要是由於目前絕大多數的AI搜索產品仍然是用文字給出答案的。儘管文字回覆能解決用戶大部分的問題,但是在入局者增多、同質化內卷的競爭環境下,誰能提供更多維度、更豐富的答案,誰或許就能掌握開啟AI搜索下一階段競爭的鑰匙。
多模態的檢索不僅對於用戶更直觀地理解搜索內容、提升搜索體驗有幫助,更是對於產品的迭代大有裨益——搭載了多模態模型的AI搜索產品能夠同時處理文本、圖像、聲音、視頻等不同類型的數據,從多元化的信息中獲取更全面的知識和上下文,這對於複雜任務的理解和執行至關重要;通過跨模態學習,AI搜索產品及其背後的模型也可以更好地泛化到未見過的情境中,提高搜索結果的準確性、適應性和實用性。
搜索結果的多模態呈現,主要來自模型能力的加持。基本上,有能力做多模態大模型的廠商,也有能力做出多模態的AI搜索產品,這也是相當一部分多模態AI搜索產品出自大廠的原因——比如360集團推出的360AI搜索支持用戶通過拍照的方式提問,也支持文檔、圖片、音頻、視頻搜索;崑崙萬維推出的天工AI搜索不僅支持AI識圖、AI圖像生成等,還具備收、寫、讀、聊、說、話、聽、唱的多模態能力,同時還生成思維導圖和大綱;小度前CEO景鯤做的AI搜索產品Genspark也能根據用戶問題生成可視化的圖表和圖片。
360 AI搜索結果,圖片來源:360 AI搜索
天工AI搜索結果,圖片來源:天工AI
Genspark搜索結果,圖片由「甲子光年」拼接
而OpenAI作為世界上實力最強的大模型公司之一,其模型的多模態處理能力自然不在話下。
在SearchGPT此次放出的演示Demo中,就展示了一個名為“視覺答案(Visual Answers)”的功能,但是OpenAI並沒有詳細解釋其工作原理。
圖片來源:OpenAI
前文提到TestingCatalog News扒出了SearchGPT的源代碼,這一源代碼中,不僅露出了Bing的接口,而且可以發現,搜索結果由多模態模型提供支持。儘管看不出具體是什麼模型和其處理流程,但該多模態模型應該具有自動理解圖像的功能。
圖片來源:X @TestingCatalog News
百度數據庫部門產品總架構師朱潔認為,SearchGPT要想做出和Perplexity等產品不同的體驗、實現作為後來者的彎道超車,最大的看點就在“多模態”。Rockset已經提供了多模態數據的檢索能力,如果能依靠多模態大模型在交互端也玩出更多“花活”,那麼獲得更大的用戶增長指日可待。
總之,Rockset的混合搜索能力,加上OpenAI的多模態大模型助力,讓SearchGPT提供了更為良好的交互體驗,而這也是OpenAI收購Rockset的初心。
在收購Rockset的公告中,OpenAI寫道:“AI has the opportunity to transform how people and organizations leverage their own data……We will integrate Rockset’s technology to power our retrieval infrastructure across products, and members of Rockset’s world-class team will join OpenAI.”(AI 有機會改變個人和組織利用自身數據的方式……我們將整合Rockset的技術,為我們的跨產品檢索基礎設施提供支持,Rockset世界級團隊的成員也將加入 OpenAI。)
OpenAI收購Rockset公告,圖片來源:OpenAI
OpenAI說希望收購Rockset是為其自家跨產品檢索基礎設施提供支持,由此可以看出,對實時數據的訪問和處理已經成為當下AI軍備競賽中的重要一環。也有業內人士指出,這筆收購從本質上說明了向量數據庫無法真正地解決“人工智能記憶(內存)”的問題,反倒是通用實時數據庫才能做到。而意識到了這一點的OpenAI也正在試圖為其內部的各個大模型建立一個紮實的“通用數據底座”,從而減少大模型的幻覺,提高AI生成內容的準確性、及時性和上下文相關性。
收購Rockset是OpenAI推出SearchGPT之前極其重要的一步棋,它補齊了OpenAI的數據短板,提高了OpenAI數據提取、處理和分析的效率和速度,也讓OpenAI能夠持續地從各種來源提取和索引數據。可以說,Rockset不僅幫助OpenAI降低了AI搜索產品的延遲,讓SearchGPT“更快”地給出答案,更是對於構建一個高效、完整、實時更新的索引庫有著巨大的助力,進一步提升了AI搜索產品回答的時效性和準確度。
3.SearchGPT,為什麼是現在?
為什麼是現在推出SearchGPT?這可能與OpenAI面臨的財務困境有關。
在The Information最近的一篇報道中提到,截至今年3月,OpenAI的推理成本(租用微軟服務器的成本)達到了40億美元,訓練成本今年可能會飆升至30億美元,再加上15億美元的人工成本,因此,OpenAI今年的企業運營成本在85億美元左右。
而從收入端看,儘管OpenAI最近每月的總收入為2.83億美元,全年收入也可能達到35億-45億美元(根據FutureSearch的估算,OpenAI 2024年的年度經常性收入約為34億美元,相差不多),但是究竟能否達到這一數字,取決於今年下半年的銷售額。
也就是說,即使OpenAI拼盡全力達到了全年35億美元的銷售額,賬面上仍然會出現約50億美元的虧損。
這就讓OpenAI不得不拼盡全力想辦法賺錢。在OpenAI的營收結構中,收入的大頭仍然是由C端貢獻的——55%的營收來自購買ChatGPT Plus的付費訂閱用戶(約為770萬),剩餘45%的營收分別來自ChatGPT企業版(21%)、API收入(15%)和ChatGPT團隊版(8%)。因此,從強大的C端基本盤入手,是OpenAI實現營收破局的關鍵。
圖片來源:FutureSearch
C端場景裡,搜索是最有價值的商業模式之一。搜索作為一個天然的大用戶量場景,曾經是PC端的第一流量入口,百度靠搜索成就了自己的江湖地位,谷歌也憑藉搜索成為全球市值最高的互聯網公司之一,在其母公司Alphabet 2023年3703.94億美元的營收中,有1750.33億美元的營收就是谷歌搜索業務貢獻的(約佔總營收的47.26%)。
圖片來源:Alphabet 2023年報
儘管ChatGPT的日活保持在5000萬上下,仍然是生成式AI領域唯一的殺手級應用,但是距離互聯網時代的Facebook、Youtube、Instagram等仍然有一定的距離。
拾象科技CEO李廣密在今年4月在受訪時表示:“如果是我,我會先把ChatGPT從5000萬的DAU做到3個億……因為ChatGPT現在還不到1000萬的付費用戶,如果做到3000萬的付費用戶,就是每年60億美金的訂閱收入,那就可以比較健康地支撐AGI每年的投入。”
搜索是一個兩千億美元的市場。目前所謂的“AI原生搜索產品”市場規模只有幾十億美元,還有很多空間等待補足。一旦將搜索功能引入ChatGPT之後,ChatGPT可能就會在訂閱制之外,衍生出廣告、推薦等更多的商業模式,拓展更多的營收來源。
除了用搜索提振流量和營收,抓住推理成本下降帶來的時間窗口期,或許是OpenAI選擇在此時推出SearchGPT的第二個原因。
搜索產品的營收不是直接來自C端用戶,而是源自C端用戶積累到一定量之後帶來的B端用戶。因此,搜索產品在現金流跑正之前,不僅有相當長的用戶獲取和運營週期,還有相當大的產品和技術的建設維護成本。
以傳統搜索引擎為例:根據摩根士丹利的報告,谷歌在2022年的搜索次數約為3.3萬億次,單次平均成本約為0.2美分。從收入看,根據崑崙萬維董事長方漢在一次播客中透露的數據,2023年穀歌搜索的廣告收入約為1600億美元,照此計算,一次搜索產生的收入約為5美分。
那AI搜索的成本是多少呢?從前文我們可以得知,AI搜索是在傳統搜索引擎的基礎上又加入了大模型的能力,因此AI搜索的成本在原有的0.2美分基礎之上,還要加入調用大模型所產生的算力、電力消耗和硬件投資,單次AI搜索的成本約為傳統搜索引擎的10倍,也就是2美分。
而今年5月以來,隨著硬件性能的提升、算法的優化和技術架構的創新,大模型的推理成本在不斷下降:比如幻方量化發佈的Deepseek-V2版本的模型,就通過創新性的MLA架構,把顯存佔用降到了過去的5%—13%,其獨創的DeepSeekMoESparse架構更是將計算量降到了極致,這一切都助推了其模型推理成本的降低;再比如OpenAI自己,他們在7月19日發佈了GPT-4o mini,通過改進模型結構、優化訓練數據和流程,GPT-4o mini做到了在性能接近GPT-4的同時,但成本相比GPT-3.5 Turbo便宜了60%以上,相較於兩年前GPT-3的text-davinci-003版本,成本更是降低了99%。
在大模型推理成本不斷降低的情況下,此時推出SearchGPT,不僅本身模型調用成本上就有優勢,更是能借助不斷增長的用戶量進一步攤平單次搜索的成本。
4.無論如何都不要單純做搜索
如果OpenAI真的是把SearchGPT作為自己引流、商業化破局的重要一步,那麼SearchGPT要怎麼在產品上突破,才更有機會成為OpenAI的“流量突破口”,吸引更多日活、實現更好地轉化呢?
「甲子光年」認為,有兩個方向:
第一個是UGC+AIGC,第二個是自動化工作流。
先來說第一個。前文我們提到,AI搜索最大的壁壘是數據,也就是內容。中國互聯網內容的陣地已經被劃分成了百度、微信、知乎、小紅書、淘寶等各種陣營,彼此之間門閥高築,相當割裂。相比於中國,國外互聯網的生態要更開放一些,各個內容陣營之間的數據流動和共享發生得更加頻繁。
由此,有一部分海外的AI搜索產品抓住這一機會點,開始探索AIGC+UGC的內容生成方式,試圖以此豐富自己的內容生態,典型代表就是Perplexity和Genspark。
Perplexity推出了Pages功能,允許用戶直接在Perplexity平臺上生成內容。用戶不僅可以將原本搜索獲取的答案轉換成一篇文章形式的“Pages”,還可以直接輸入問詢詞,Perplexity會搜索公開的文章或報道直接生成一篇Pages。不僅如此,Perplexity還能根據用戶的需求對Pages進行重寫、格式化或刪除,或者插入相關的圖片和視頻。
圖片來源:Perplexity
小度科技前CEO景鯤創立的Genspark也不例外。
在ProductHunt上,Genspark對自己的介紹是:“一個AI代理引擎,其中專門的AI代理進行研究並生成名為Sparkpages的自定義頁面。Sparkpages沒有偏見和SEO驅動的內容,綜合了可信的信息,提供更有價值的結果,為用戶節省時間。”
Sparkpages是Genspark的核心:用戶在搜索問題後,Genspark不僅像其他AI搜索產品一樣先給出一個回答,還會通過整合搜索結果生成一個主題網頁,該主題網頁就是Sparkpages。它會以結構化的方式,展示搜索主題相關的文字、圖片、視頻等,以瀑布流的方式呈現給用戶。
圖片來源:Genspark
Sparkpage不僅通過“信息聚合網頁”的形式讓用戶更快速有效地訪問信息,更是允許用戶對生成的頁面進行復制和編輯:在每個Sparkpage的右上角都有一個按鈕“Copy and Create My Plan ”,點擊後會打開一個已經複製了剛才Sparkpage內容的編輯頁,用戶可以在右側的Copilot一欄針對左側的Context Pool做上下文的提問、調用外部搜索獲取答案、同時還可以把Copilot裡的內容一鍵複製到左側的Sparkpage裡。和Perplexity的Pages一樣,Sparkpage同樣可以被搜索引擎的SEO索引到。
景鯤前下屬、AI從業者劉佳(化名)告訴「甲子光年」,景鯤還在小度工作的時候,就多次提到要“重構搜索背後的內容生態”,因此Genspark走這種“AIGC+UGC”的模式並不意外。
“AI搜索目前最大的壁壘在於背後信息源的質量,Genspark的優勢就在於,短期內可以通過高質量的信息源+AI理解滿足搜索需求,滿足後生成高質量的結構化總結頁面Sparkpage,這些內容又再次被搜索收錄,相當於AI搜索產品內容的‘自產自銷’。這種方式可以形成一個內容的數據飛輪。假設這一飛輪能轉起來,那麼理論上用戶用得越多,優質內容就會越多,能慢慢構建起搜索背後的內容壁壘。”劉佳說。
劉佳在社交媒體上對Genspark的評價,圖片來源:即刻
儘管SearchGPT在AIGC的內容方面已經做得很不錯了,界面簡潔、用戶體驗舒適、信息來源質量高,但是在UGC的方面依然做得不夠,不知是否能在後續的正式版本中看到這一功能。
而AI搜索產品“自動化工作流”的實現,則主要依賴Agent,尤其是多Agent聯用(Multi-Agent)的能力。AI搜索引擎與傳統搜索引擎最大的不同,在於它們不只能將搜索結果進行總結與分類,還能在此之上有更進一步的動作,比如生成思維導圖、生成PPT、進行工作和生活規劃等。這背後的能力,都取決於Agent。
其實目前大部分的AI搜索產品都加入了AI Agent的能力,那些在資料整理之上“玩花活”式的呈現基本都是靠Agent插件實現的,比如360 AI搜索文檔分析問答、分析網頁內容、分析總結音視頻、生成思維導圖的功能,秘塔AI搜索的思維導圖、梳理各種關聯人物事件、搜索學術論文和播客的功能,天工AI搜索的文檔+音視頻分析、AI音樂、AI PPT等功能;
阿里國際最近推出的B2B AI搜索引擎,背後似乎也加入了AI Agent的能力。它能主動理解採購者的自然語言,並轉化為專業的採購請求。更進一步,它還能根據全球市場數據預測需求、提供建議,實現更精準的匹配。用戶只要在新的AI搜索引擎中用“大白話”詢問,它會通過與用戶的對話,更精確地理解用戶的需求,為用戶推薦多種選擇,並主動比較、總結優劣,最終幫用戶完成交易和履約送貨。
阿里國際在法國巴黎宣佈推出全球首個AI驅動的B2B搜索引擎,圖片來源:阿里國際
但是在多Agent聯用方面,目前能做到的AI搜索產品還比較少,只有博查AI搜索、Genspark等產品在嘗試。
比如博查AI搜索首創了多智能體搜索(Agent Search)+多模態搜索(Media Search)的模式,引入了AI智能體和高質量UGC內容,會識別用戶搜索需求,並匹配相應的智能體進行作答,還支持搜網頁、搜短劇、搜視頻、搜圖片等。
博查AI搜索的整體架構基於字節釦子(Coze)開發者平臺開發,並且和釦子合作打通了智能體發佈渠道,未來開發者創作的智能體可以直接發佈到博查,既能為大家提供更豐富的搜索內容,也能夠為開發者的智能體提供定向流量。
Genspark也利用了多智能體框架,每個智能體都能針對特定類型的查詢提供專業服務,確保搜索結果的精準性和相關性。有博主對Genspark的搜索流程進行了拆解後發現,每次搜索過程中,Genspark至少調用6個AI Agent,和4—14次的大模型。
圖片來源:AI產品Rena
上述Agent更多屬於用Agent實現自動化的工作流,更多聚焦通用搜索;在垂直搜索方面,Genspark也用了三個Agent,來處理用戶旅遊、商品和圖片的搜索意圖。
圖片來源:Genspark
用戶不僅可以點擊對應的標籤進入到特定的Agent頁面,也可以點擊輸入框,選擇對應的Agent,進入針對性的Agent搜索。
圖片來源:Genspark
在第十二屆互聯網安全大會期間,周鴻禕告訴「甲子光年」,Agent最重要的是解決了大模型無法“慢思考”的問題,Agent在AI搜索產品裡是必不可少存在。
“人腦有快思考、慢思考兩種方式。大模型常見的是快思考,問2+2等於幾,它脫口而出。但是真的有複雜的問題,比如寫一篇論文、做分析,人類是需要慢思考,需要調動規劃和反思、邏輯推理能力,速度慢,但準確性高。大模型目前只有快思考沒有慢思考的能力,我們提出用Agent的框架打造慢思考的系統,通過知識和工具、增強大模型的規劃,打造大模型的慢思考的能力。”周鴻禕說。
不過,或許是還在產品原型階段的原因,目前,我們沒有看到SearchGPT裡“多智能體”的能力,但是由於SearchGPT是集成在ChatGPT中的,未來OpenAI或許會將其與GPT Store中的智能體(GPTs)打通,聯合起來為用戶提供服務。
另外,周鴻禕還強調,大模型企業做AI產品時,一定要注意“與場景結合”,才能實現最好的用戶體驗。OpenAI推出搜索產品,也意味著其越來越注重“場景”的重要性。
正如a16z創始人馬克·安德森(Marc Andresson)給Perplexity創始人阿拉文德·斯里尼瓦斯(Aravind Srinivas)的建議,“無論如何都不要單純做搜索”——無論是UGC還是多Agent,都是搜索產品的“術”;只有找到合適的用戶使用場景,才能“道術合一”,實現增長。
*參考資料:
《AI搜索產品深度分析-搜索原理和商業模式分析》,AI產品Rena
《拳打Google,腳踢Perplexity,Genspark要做美女給你打好飯還喂進嘴!的新物種》,AI產品黃叔
《我做了一個AI搜索引擎》,艾逗筆
《Why OpenAI Could Lose $5 Billion This Yer》,The Information
《OpenAI Revenue Report》,FutureSearch
《張鵬對談傅盛、方漢:AI 搜索的機會在哪,OpenAI 為什麼沒入局?》, AI局內人 | AGI Insider播客
《國內增速第一的360AI搜索在做什麼?| 對談360VP 梁志輝》,AI產品經理播客
《AI搜索揭秘:套殼之王Perplexity究竟有多難?獨立開發是否有機會?》,硬地駭客播客
(封面圖來源:「甲子光年」使用AI工具生成)
本文來自微信公眾號“甲子光年”,作者:王藝,36氪經授權發佈。