實測百度搜索 DeepSeek 滿血版:“為我所用”還是“拿來主義”?

百度搜索目前已全量上線DeepSeek滿血版並提供聯網服務,其中PC端開放僅1小時就有超千萬人使用。

圖片來源:由無界AI生成

繼2月16日百度搜索全面接入DeepSeek和文心大模型最新的深度搜索功能之後,目前的百度搜索已全量上線DeepSeek滿血版。

當下,用戶可在百度APP輸入任意搜索詞,完成一輪搜索後,在搜索結果頁點擊「AI+」進入AI搜索,再點擊下方「去試試“滿血版”」即可與DeepSeek對話。此外,PC版百度AI搜索也已經接入DeepSeek R1滿血版並提供聯網能力。

百度AI搜索的DeepSeek滿血版效果到底如何?在進行過數十個測試後,不禁感嘆:百度AI搜索是真滿血!接入最好的DeepSeek模型能力的百度AI搜索,打開了新世界的大門。

“為我所用”而非“拿來主義”

接入DeepSeek後,百度不對其進行閹割,也讓服務器資源管夠。這背後是百度的為我所用,而不是拿來主義。這一過程並非是把 DeepSeek 接過來就直接給用戶去用,百度有自己的「真東西」在。

要問這一“真東西”是什麼?其直接體現在百度通過深度的技術融合、RAG技術優勢,幫用戶解決大模型幻覺等實際問題。說到底,是百度25年的數據積累。作為全球最大的中文搜索引擎,百度積累了用戶搜索行為數據、網頁索引數據和內容生態數據。這些數據覆蓋了從PC互聯網到移動互聯網、再到AI時代的多維度信息,包括文本、圖像、視頻等,形成了獨特的“時間壁壘”,是新興AI搜索難以複製的。

先來一個能考察25年時間跨度的題目:細數過去的25年中,中國新能源行業的發展歷程,要求包括明確的時間節點、時間節點以及其所帶來的影響和意義。百度AI搜索DeepSeek-R1滿血版得到的回答如下:

答案中詳細羅列了中國新能源行業25年的發展歷史,並將其劃分為不同階段,部分數據是其他AI搜索引擎中所沒有的。

而在搜索這一問題的過程中,百度AI搜索也展示了新功能“特色靈感區”,能歐根據當前提問,提供靈感內容,幫助用戶梳理問題脈絡,一問便能瞭解問題全貌。也可以通過點擊靈感區任意問題即可發出對應提問。

值得注意的是,目前市面上大部分的AI搜索產品,都會展現模型“思考”的過程,然而其展現形式更多的是“正在搜索XXX個網頁”,而接入DeepSeek R1滿血版的百度AI搜索,能夠細細拆分問題。輸入 Prompt:請統計出2010至2015年期間,世界範圍內GDP排名的變化情況,需提供具體數值並展現變化的過程。

從第一步的確定數據來源是否可靠、到界定請問題範圍是名義 GDP 還是購買力評價(PPP)調整後的GDP、到搜索出早年的數據和進行排名,這彷彿人腦在層層剖析一個問題的過程。

令人驚豔的是,DeepSeek R1滿血版的百度AI搜索能夠全面地考慮到各種微小的細節、周到地考慮到特殊情況應該如何處理,諸如,要注意各國GDP實際增長速率和波動情況、匯率波動影響、數據處理中四捨五入的部分,這確實是我沒想到的。不僅感嘆一句:DeepSeek R1滿血版的百度AI搜索,還是太全面了!

針對這一問題的完整回答如下,在未被提示的情況下,自動選擇表格的方式進行展現,並且在關鍵事件處給了明確的提示。

百度RAG疊加DeepSeek-R1之後,其幻覺程度是否真的被降低?接下來的一道題目則測試百度AI搜索DeepSeek滿血版的幻覺程度:請提供一份2005年2月20日的全球股市收盤數據。

這一問題的刁鑽之處在於,2005年的2月20日是週日,絕大多數國家並不會在週日開市。如果模型具有幻覺的話,則無法避開這個“坑”,會開始拿其他事件的數據張冠李戴到2005年2月20日。但百度AI搜索的DeepSeek滿血版思考過程如下:

根據思考過程可知,而是在分析過程中就界定清了問題,並沒有“一本正經地胡說八道”,給出的答案也嚴謹準確。

以此為基礎,再將問題升級一個難度為:提供2005年2月18日歐洲市場的逐時數據。這對答案的顆粒度要求較細,百度AI搜索DeepSeek R1滿血版的回答如下:

百度背後多年積累的專業數據,同樣也在兩者結合後得到了更好地釋放。向模型提問專業問題:請詳細分析中國藥品價格的形成機制及其影響因素,並結合當前政策背景,說明醫保藥品價格談判的作用和意義。

這一問題針對醫療行業的藥品價格問題,測試模型對特定領域知識的專業度和成熟度。並且問題中明確要求結合當前的政策背景,也考驗模型是否能準確捕捉到時新信息。給出的回答如下:

答案中包含多處數據細節,如在“以價換量”提高基金使用效率中標註出PD-1抑制劑年治療費用從30萬降至5-10萬,74種新藥納入醫保目錄中指出CAR-T療法從120萬元降至33萬,說明模型對醫療藥品這一專業行業的數據有較深的積累。

DeepSeek-R1讓百度AI搜索的推理能力如虎添翼,同時,百度AI搜索本身也在發揮自身優勢,將多模態能力疊加在了大語言模型DeepSeek之上。輸入prompt:我要拿一幅畫去參加塗鴉插畫的比賽,主題是“未來城市”,創造一個充滿奇幻元素的世界,比如神秘的森林、魔法城堡、外星生物、精靈與巨人等,需要給出圖片。這一問題中包含多個畫面主題,既需要大語言模型的能力加以理解,又需要圖像模型進行生成,最後得到的畫面如下:

開啟DeepSeek-R1滿血版後,百度AI搜索的代碼能力也更上一層樓。輸入prompt:請寫出一個生成畫面為“祝賀哪吒票房大賣,並配上哪吒形象”的代碼,並檢測代碼效果。得到的答案如下:

這一回答中不僅包含了完整代碼的運行文件,更給出了視覺元素驗證、動畫檢測、兼容性測試等檢測說明,更給出了效果增強建議的代碼,用戶可以進行自定義的調整。

迴歸用戶價值,而非技術孤島

時至今日,回顧中國人工智能發展史,無論是早在2010年左右開始佈局NLP、知識圖譜、機器學習等關鍵技術的研發,還是大語言模型浪潮中“先人一步”開發出 ERNIE Bot,百度對人工智能的態度一致都是“堅持高度自研、加大投入力度”。

即便“堅持自研如百度”,面對 DeepSeek 的衝擊,百度也開始在自家超級APP中接入外部大模型,將第三方模型夥伴納入自己的生態。這是在大模型戰略下以產業操作系統為目標的一次進展,本質上是百度圍繞“大模型+搜索”構建的生態級戰略組合拳。

這意味著,百度搜索迴歸用戶價值本身,不但沒有固步自封,而是將自身的核心業務和重點業務與DeepSeek做探索融合。背後所指向的趨勢是中國互聯網從超級APP、自給自足的“孤島生態”,正在轉向連接越來越緊密的“技術共同體”。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論