谷歌突砍Gemini免費版炸鍋,數據養模遭背刺?GPT-5.2突襲Gemini 3,Demis Hassabis:谷歌須佔最強位

avatar
36氪
12-08

“谷歌剛把免費版 Gemini API 的每日請求次數從 250 降到了 20,我的 n8n 自動化腳本現在基本都用不了了。這對任何開發小型項目的人來說都是個打擊。”網友 Nilvarcus 表示。

近日,有網友曝出 Google 收緊了 Gemini API 免費層級的限制:Pro 系列已經取消,Flash 系列每天僅 20 次。這對開發者來說遠遠不夠用。

還有網友發現,谷歌已經從其“批量 API 速率限制”列表中刪除了 Gemini 免費 API 項。“它徹底結束了。”

在激烈的大模型競賽中,谷歌也曾用免費低價政策吸引用戶,比如在今年 1 月,谷歌推出了 Gemini API 的 Gemini 1.5 Flash 免費套餐,每天為開發者提供高達 15 億個免費 Token。這一免費套餐包括每分鐘 15 次請求、每分鐘 100 萬個 Token,以及每天 1500 次請求的使用權限。此外,開發者還能享受免費的上下文緩存服務,每小時可存儲多達 100 萬個 Token。微調功能也完全免費開放。

除了極大的降幅,讓一些開發者生氣的是這項政策沒有任何提前告知。

“我一直認為天下沒有免費的午餐。但這次 Google 的做法,真的不行。即使我的系統和用例只是實驗性質,但當所有東西在毫無預警的情況下突然全部停擺,那種感覺讓人很受傷。他們就不能在發佈 Gemini 3 的時候說一句:‘順帶一提,隨著新模型上線,我們會在兩週後取消開發者的免費 API 調用額度’?一家負責任、值得信任的公司,本該這樣做。”有開發者說道。

“是的,谷歌目前已經收集了足夠的數據,並且領先於競爭對手,所以他們正在轉變策略,大力推進盈利。我們都知道免費套餐一開始就太慷慨了,但我們是用自己的數據來支付費用,並幫助他們訓練模型。”有開發者表示,“AI 小善人,公域粉吸完了,現在是準備付費轉化了。”

這周或與 OpenAI 再戰 

前段時間,谷歌憑藉 Gemini 3 贏得了一大批用戶。另外根據《金融時報》數據,截至 2025 年底,用戶在桌面端和移動網頁端單次使用 Gemini 的平均停留時長已經達到約 7.2 分鐘,首次超過 ChatGPT 的約 6 分鐘,也略高於 Anthropic Claude 大約 6 分鐘的水平。

但激烈的大模型爭奪戰仍在繼續。據報道,OpenAI 正計劃通過即將推出的 GPT-5.2,對谷歌 Gemini 3 作出首次回應。原計劃於 12 月底發佈的 GPT-5.2 預計將提前至 12 月 9 日發佈。GPT-5.2 的基準測試結果也已經在網上傳開。如果這些數據最終被證實,那麼這場競爭優勢就又回到了 OpenAI 手中。

就在網傳 GPT-5.2 發佈之際,網友發現 Gemini 3 Flash 現已登陸 LM Arena,還有人稱 “Gemini 3 Flash 似乎是谷歌對標 GPT 5.2 的產品。”

這讓網友們非常興奮:“太精彩了,OpenAI 和 Google 攻守雙方完成了對接。Nano Banana pro 和 Gemini 3 Flash 是 Google 準備的後手,以狙擊 OpenAI 本週發佈的 GPT-5.2 。”

“AI 行業某些部分可能確實存在泡沫,比如荒謬的高額種子輪融資,但我比任何人都相信 AI 是最具變革性的技術,從長期來看這些投入都是值得的。我的工作是不論泡沫破不破,DeepMind 和 Google 都必須處於最強位置。”Google DeepMind 聯合創始人兼首席執行官 Demis Hassabis 在參加 Axios 活動時候說道,可見其與 OpenAI 競爭到底的決心。

谷歌對  Gemini 3 表現滿意

這場競爭中,前期表現不佳的谷歌,憑藉 Gemini 3 拿下一城。

“我們對 Gemini 3 的個性、風格和能力都非常滿意。我喜歡它回答得簡潔,也會在必要時反駁你一下,而不是凡事都附和。如果你的觀點不太合理,它會溫和地推回去。我覺得大家能感受到這是一種階躍式的智能提升,也因此更有用。”Hassabis 說道。

這不禁讓人想到此前 OpenAI 因 ChatGPT 過於諂媚,而回滾了 GPT-4o。看得出來,谷歌刻意規避了這個問題。

Hassabis 很喜歡看到用戶使用 Gemini 3 進行各種嘗試。 你一旦發佈新技術,幾百萬、甚至數十億用戶會立刻使用,我們不斷被用戶很快發明出來的各種酷炫用法驚到。這就是我們如此熱愛當前這個科研與產品緊密結合時代的原因。”

他個人最喜歡的是 Gemini 3 可以“一次性”完成遊戲製作。

“回到我最早做遊戲 AI 的年代,我認為我們現在已經非常接近能夠用模型在幾小時內創建商業級遊戲,而這過去需要幾年時間。這說明了模型難以置信的深度與能力:它能理解非常高層次的指令,並生成非常細緻的輸出。Gemini 3 另外一個特別強的地方是前端開發、網站開發,它在審美、創造性和技術上都非常優秀。”

“所有模型都是這樣,創新速度太快,我們花太多時間在構建新版本,以至於我們沒有時間去探索現有模型能力的十分之一。” Hassabis 表示,“每次我們發佈新版本時,我都會有一種感覺:我甚至沒來得及去探索現有系統的十分之一,就得馬上投入下一代的研發,還要確保安全、可靠等等。所以反而是用戶把它們用得比我們內部還深入。”

把 Scaling Law 推到極致 

對於這次突然限制免費 Gemini API,有網友表示懷疑,“是不是算力不太夠了,最近幾天一直在 AI Studio 玩 Nano Banana Pro,前天開始速度很慢,一張圖等半天。”還有人猜“新模型發佈,老模型沒下,卡緊張了。”

雖然不知真正原因,但就像 Hassabis 說的谷歌會一直需要算力:“我們在 Google、在 DeepMind,確實擁有很多資源,但不是無限的。我們永遠需要更多算力,不管現在有多少算力都不夠。我們之所以能夠開展如此廣泛的研究,是因為有這些資源。”

他依然主張 Scaling Law。在回答 “AGI 是否會僅靠改進大模型和生成式 AI 實現”的問題時,Hassabis 表示,“我們必須把當前系統規模推到極限,它至少會成為 AGI 的關鍵組成部分。也有可能光靠規模化就夠,但我猜回頭看,我們會發現還需要一兩次類似 Transformer 或 AlphaZero 那樣級別的突破。”

Hassabis 認為大概五到十年才會達到 AGI,不過他對 AGI 的標準很高:它必須具備所有人類認知能力,包括創造能力、發明能力。

他解釋道,當前的 LLM 在某些方面像博士、像奧賽冠軍,但在其他方面仍然很弱,比如一致性、持續學習、長期規劃、複雜推理等。它們是鋸齒狀智能。它們最終會具備這些能力,但可能還需要一兩次重大突破。

Hassabis 回憶,2017、2018 年那段時間,谷歌有很多項目:有自己的語言模型 Chinchilla、內部用的 Sparrow,團隊還最早發現了一些擴展法則,也就是 Chinchilla Scaling Law;也有其他方向:如基於 AlphaGo 的 AlphaZero、純強化學習系統,以及受認知科學和神經科學啟發的架構。“當時我們並不確定哪條路能最快、最安全地通向 AGI。我的任務就是建成 AGI。”

“我其實對路徑非常務實:它必須有效。當我們看到規模化開始真的起作用,我們就持續把更多資源投入那條研發分支。”Hassabis 稱,“這就是科學方法的美妙之處。如果你是真科學家,就不能教條地堅持自己某個想法,而必須跟隨實證證據。”

身為科學家的優勢 

而作為一名科學家,Hassabis 處理一切問題的默認方式,就是科學方法。他認為,科學方法可能是人類歷史上最重要的思想之一,因為它催生了啟蒙運動、現代科學,也構建了現代文明。科學方法的實驗精神、假設更新、證據驅動,是一種極其強大的思維方式,而且它不僅適用於科學,還適用於日常生活甚至商業。

“我們處在科技史上可能最激烈的競爭中,但我們憑藉嚴謹與精確脫穎而出,而科學方法是我們工作的核心。我們把頂尖研究、頂尖工程技術和頂尖基礎設施相結合,而在 AI 前沿領域,你必須同時具備這三者。我認為在這三個領域都擁有世界一流能力的機構並不多見,而我們正是其中之一。”Hassabis 說道,“我一直把它用到極致,我認為這也是我們作為研究機構和工程團隊的優勢所在。”

在 AI 人才的爭奪上,Hassabis 直言“最近確實很瘋狂,比如 Meta 的一些做法。”但他表示,谷歌尋找的是“使命驅動”的人。“DeepMind 有最好的使命、有全棧能力,如果你想做最有影響力的工作,這裡是最佳地點。最優秀的科學家和工程師想要參與最前沿的系統,而這反過來又吸引更多頂尖人才。”

谷歌未來的三個主打方向 

作為全球 AI 大模型的領頭羊之一,谷歌的發力方向很值得業內關注。

根據 Hassabis 的說法,谷歌正努力推進的方向有三個。

首先是模態融合。Gemini 從一開始就是多模態模型,能夠接收圖像、視頻、文本、音頻,並且現在越來越能生成這些模態的內容。谷歌正在看到跨模態互相促進的效果。一個例子是最新的圖像模型 Nano Banana Pro,它展現出驚人的視覺理解能力,可以生成非常準確的信息圖。 Hassabis 認為未來一年在視頻與語言模型融合方面,我們會看到非常有意思的能力組合。

谷歌正在研發並已投入使用的技術中,Hassabis 認為令人驚歎且未被充分關注的,是這些模型具備的多模態理解能力,尤其是視頻、圖像和音頻的多模態處理能力,其中他特別強調視頻處理。

“如果你讓 Gemini 處理一段 YouTube 視頻,你可以向它提出各種各樣的問題,它對視頻內容的概念性理解程度常常讓我感到震驚。雖然並非每次都能完美理解,但多數情況下,它的表現都令人印象深刻。”

Hassabis 拿自己喜歡的電影《搏擊俱樂部》舉例,其中有一個場景是有人在打架前摘下了戒指。他曾問 Gemini 這個動作的意義是什麼,它給出了一個非常有趣的哲學解讀:這個動作象徵著脫離日常生活,展現出一種放下世俗束縛的態度。“這種深層次的元認知洞察力,是這些系統如今具備的強大能力之一。”

另外,谷歌還有一個名為 Gemini Live 的功能,你可以用手機對準某個物體,比如告訴你的手機“你是一名機械師”,它就能幫你處理眼前的相關任務。理想情況下,這種功能應該應用在眼鏡等設備上,這樣你就可以解放雙手。但 Hassabis 認為人們目前還沒有充分意識到這種多模態能力的強大之處。

其次是世界模型,Hassabis 個人正在親自推動這一塊發展。“我們有一個系統叫 Genie 3,是一種交互式視頻模型。你可以生成一個視頻,然後像走進遊戲或模擬世界一樣進入其中,並且它能保持大約一分鐘的連貫性,這是非常令人興奮的。”

最後則是智能體系統。Hassabis 指出,現在的 agent 還不夠可靠,不能完成全任務,未來一年會有重大進展。

“我們有一個願景叫通用助手(universal assistant),希望 Gemini 最終變成這樣。未來一年你會看到它進入更多設備。”Hassabis 說道。所謂通用,不只是電腦、筆記本或手機,也可能是眼鏡或其他設備。

“我們想創造一個每天都能幫助你、你每天要多次諮詢的助手,成為你生活的一部分,提升你的工作效率,同時改善你的個人生活,比如給你推薦書、電影或你喜歡的活動。不過,目前的 agent 還不能讓你把一個完整任務全權委託給它,並且放心它會可靠地完成。但一年後我認為我們會看到接近能夠做到這一點的 agent。”

Hassabis 還提到了,隨著 agent 更強、更有自主性,它們會更有用,所以各行業一定會構建,但它們越自主,就越可能偏離你最初的指令或目標。因此如何確保能夠持續學習的系統保持在你設定的護欄內,是非常活躍的研究領域。

他表示,好消息是,AI 如今具有巨大的商業價值。如果你作為模型提供方向企業出售 agent,那些企業會要求你提供可靠性保證、數據處理保證、客戶行為保證。如果出了問題,它不會是“滅絕級”的,但你肯定會失去生意。而企業會選擇更負責任、有更強保證的供應方。所以資本主義本身會在一定程度上激勵更負責任的行為。當然,如果做得不當,也有可能跳出護欄。概率不是零,而這正是最大的不確定性之一。既然概率不是零,那就必須嚴肅對待並投入資源進行緩解。

此外,Hassabis 在訪談中還提到,在全球競爭中,他認為美國和西方目前仍領先,但中國也沒有太遠,最新的 DeepSeek 或其他模型都很強,有非常有能力的團隊。“領先優勢可能只剩‘幾個月’,而不是‘幾年’。”

Hassabis 表示,在剔除芯片因素後,西方依然在 AI 算法創新方面佔優勢。“中國的團隊非常擅長快速追趕當前最先進的方法,但在提出超越現有前沿的全新算法方面,目前還沒有看到類似突破。”

參考鏈接:

https://www.youtube.com/watch?v=tDSDR7QILLg

https://x.com/legit_api/status/1997792538074436066

https://x.com/miantiao_me/status/1997491016467709981?s=46

本文來自微信公眾號“AI前線”,整理:褚杏娟 ,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論