重新定義搜尋:人工智慧 + 搜尋帶來的機會

預計推薦系統將在未來幾年內激增,並從傳統搜尋中奪取份額。

作者:阿法兔

封面:Photo by DeepMind on Unsplash

事件

本文 2100 字左右

“搜尋” 賽道象徵著一種橫跨消費者、企業和開發者生態系統的、上萬億美元的機會隨著搜尋系統變得更加個性化,我們預測搜尋和推薦之間的界限將變得模糊。我們預計推薦系統將在未來幾年內激增,並從傳統搜尋中奪取份額。

BVP 最近發了一篇文章,其中提到:

人工智慧的技術突破,正在重塑資訊合成和檢索的新模式。從去年開始像 ChatGPT、Stable Diffusion、Dreamfusion 這類產品的爆紅,以及以及即將釋出的 GPT-4 等,大模型的潛力激發了不少新的創業公司。這裡提到的搜尋並僅僅是谷歌這樣的公共網際網路搜尋。

這裡的搜尋,指的是能夠查詢資訊,並最終綜合和得出結論的能力。

這裡對 “搜尋” 的定義,包含企業(B 端)檔案搜尋,到 C 端對話式的搜尋產品等等。

“搜尋” 賽道象徵著一種橫跨消費者、企業和開發者生態系統的、上萬億美元的機會:通過人工智慧驅動的搜尋概覽圖,我們試圖探討一下,究竟是什麼在催化這種進化。

重新定義搜尋

機器學習和軟體基礎設施的進步,釋放了全新資料型別,並搜尋可以具備理解上下文的能力,那麼,這些進步來自於哪些原因?

1.  先進的多模態模型出現。想要搜尋比如說影象和視訊等非結構化的資料是非常困難的。但是,像 OpenAI CLIP 和 LAION 等文字-影象模型那樣,近期的進步與技術上的突破,提高了模型的保真度,將非結構化資料嵌入到緊湊表示法中。這些表徵通常以向量體現,這樣就可以使更先進的多模態的模型用於影象、視訊和其他各類豐富資料型別。例如,Coactive.ai 為影象資料提供了 SQL 的查詢介面,能夠幫助團隊快速訪問、組織和利用他們的視覺資料。

2. 語境意識和基本推理的進步:過去的搜尋系統提供關鍵詞搜尋,但現代模型提供的是語義搜尋,或有意義的搜尋能力。現代搜尋系統也可以感知上下文,並參考使用者意圖和歷史行為。而現在,由於大語言模型的出現,這些系統可以執行基本的推理任務。這樣,就帶來了一個更為直觀和對話式的搜尋,它不僅可以理解搜尋歷史,進行綜合研判。

典型的例子就是 OpenAI 的 ChatGPT——提供了更好的搜尋工具。ChatGPT 以一種看起來帶狀態的、像人一樣的迴應的形式展現資訊,使用者可以反覆完善和調整他們的搜尋體驗。

比如說,如果一個使用者問:” 我今天應該穿什麼?” 人工智慧工具可能會先問試探性的問題,如 “ 你想要大家怎麼看待你的風格?” 然後再綜合得出相應答案。

3. 能夠建立在現有的成果的基礎上。許多大語言模型通過與 API 的整合和與使用者介面的動態互動,插入到現有的軟體堆疊中(例如 Perplexity、Adept、OpenAI 的 Codex 和谷歌的 Mind’s Eye 的下代搜尋產品等等)。同樣,像 Seek.ai 和 Hearth.ai 這樣的公司,也可以模型嵌入到在資料庫和 CRM 中,隨著語言模型與現有產品更多地進行對接,搜尋系統能夠覆蓋更多領域,並能更好地進行通知釋出。

圖片來源:BVP

新興的大語言模型生態系統

4. 基礎設施規模:公司發現了嵌入向量(註解:用一個向量來表示一個詞/一個句子/一個圖片就叫做嵌入,因為本質是把高維的影象/語言資訊在保留一定區域性度規的前提下對映到一個較低緯度的空間)的價值,可以在 Zilliz(Milvus)、Pinecone、Vespa 和 Weaviate 等向量資料庫以及 Jina、Qdrant 和 FAISS 等開源庫上,繼續進行構建和擴充套件工作負載。除此之外,研究人員也在研究模型大小和資料量等因素,到底會如何影響大型神經網路的模型效能。分散式深度學習領域已經開始發展,排期優化和(資料)並行技術能夠進一步擴充套件人工智慧模型和資料量。排期優化

5. 搜尋和推薦的界限會逐步模糊。隨著搜尋系統變得更加個性化,我們預測搜尋和推薦之間的界限將變得模糊。例如,TikTok 在最近幾年發展迅速,位元組跳動的個性化、不斷改進的推薦模式體驗,已經成功地從 Youtube 等傳統的視訊搜尋產品中搶佔了市場份額,我們預計推薦系統將在未來幾年內激增,並從傳統搜尋中奪取份額。

人工智慧正在重新塑造搜尋。我們看到消費者和企業搜尋以及基礎設施層都有持久的創新。

AI 搜尋市場概覽

圖片來源:BVP

如果我們從人工智慧搜尋市場的角度來看,目前人工智慧搜尋賽道已經出現了一系列公司,比如 To C 的(Tik Tok 也算在其中,還有像 Neeva 釋出的世界上首個私密和無廣告的搜尋引擎)、To B,以及專注做基礎設施的等等。

智慧搜尋:剛剛開始的時代

隨著人工智慧降低高質量建立的內容的質量和製作成本,數字內容的數量將出現爆炸性增長。我們預測,在未來十年內,至少 50% 的線上內容將由人工智慧產生、或者由人工智慧改進。隨著資訊爆炸的時代到來,會需要更好的智慧搜尋,來組織和總結這些資訊。
隨著使用者資料越來越重要,甚至成為企業的關鍵資產,企業可以用搜尋體驗來更好地分析資料,以進行商業決策,而在消費者環境中,人們將從更準確、更個性化、更精細的結果中受益,這將影響到人們聯絡、購物或學習的方式。

參考文獻:

1.https://www.bvp.com/atlas/entering-the-era-of-intelligent-search?utm_source=email&utm_medium=organic&utm_campaign=entering-the-era-of-intelligent-search

免責宣告:作為區塊鏈資訊平臺,本站所釋出文章僅代表作者及嘉賓個人觀點,與 Web3Caff 立場無關。文章內的資訊僅供參考,均不構成任何投資建議及要約,並請您遵守所在國家或地區的相關法律法規。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論