谷歌在Gemini 2.5 Flash 中引入 AI 推理控制

avatar
AI News
04-23
本文為機器翻譯
展示原文

谷歌為其 Gemini 2.5 Flash模型引入了一種人工智慧推理控制機制,允許開發者限制系統在解決問題時消耗的處理能力。

在4月17日釋出的這個"思考預算"功能,是對日益增長的行業挑戰的回應:先進的人工智慧模型經常過度分析直接的查詢,消耗不必要的計算資源,並增加運營和環境成本。

雖然不是革命性的,但這一發展代表瞭解決效率問題的實際步驟,這些問題隨著推理能力成為商業人工智慧軟體的標準而出現。

這個新機制使開發者能夠在生成響應之前精確校準處理資源,可能會改變組織管理人工智慧部署的財務和環境影響。

"該模型思考過度,"Gemini產品管理總監Tulsee Doshi承認,"對於簡單的提示,模型確實思考得比需要的更多。"

這一承認揭示了先進推理模型面臨的挑戰 - 就像使用工業機械來破開一個核桃。

轉向推理能力帶來了意想不到的後果。傳統的大型語言模型主要是匹配訓練資料中的模式,而新版本則試圖邏輯地、逐步地解決問題。雖然這種方法在複雜任務中能產生更好的結果,但在處理簡單查詢時會引入顯著的低效率。

平衡成本和效能

未經控制的人工智慧推理的財務影響是巨大的。根據谷歌的技術文件,當完全啟用推理時,生成輸出的成本大約是標準處理的六倍。這種成本乘數為精細控制提供了強大的動機。

在Hugging Face研究推理模型的工程師Nathan Habib描述,這個問題在整個行業中都很普遍。"在炫耀更智慧的人工智慧的過程中,即使沒有釘子,公司也在使用推理模型作為錘子,"他向MIT技術評論解釋道。

這種浪費並非只是理論上的。Habib展示了一個領先的推理模型在嘗試解決有機化學問題時,陷入了遞迴迴圈,反覆重複"等等,但是……"數百次 - 本質上是經歷了計算崩潰並消耗處理資源。

在DeepMind評估Gemini模型的Kate Olszewska證實,谷歌的系統有時也會遇到類似問題,陷入迴圈,耗盡計算能力而不改善響應質量。

精細控制機制

谷歌的人工智慧推理控制為開發者提供了精確的程度。該系統提供了從零(最小推理)到24,576個代幣的"思考預算"的靈活範圍 - 這些代幣代表模型的內部處理。這種精細的方法允許根據特定用例進行定製部署。

DeepMind的首席研究科學家Jack Rae表示,確定最佳推理水平仍然具有挑戰性:"現在很難劃定界限,比如什麼是當前思考的完美任務。"

發展理念的轉變

引入人工智慧推理控制可能預示著人工智慧發展方式的改變。自2019年以來,公司一直致力於透過構建具有更多引數和訓練資料的更大模型來改進。谷歌的方法表明了一種替代路徑,專注於效率而非規模。

"規模定律正在被取代,"Habib說,表明未來的進步可能來自最佳化推理過程,而不是不斷擴大模型規模。

環境影響同樣重大。隨著推理模型的普及,其能耗也成比例增長。研究表明,推理 - 生成人工智慧響應 - 現在對技術的碳足跡的貢獻比初始訓練過程更多。谷歌的推理控制機制為緩解這一令人擔憂的趨勢提供了潛在的因素。

競爭動態

谷歌並非獨自行動。今年早些時候出現的"開放權重"DeepSeek R1模型展示了強大的推理能力,可能成本更低,觸發了市場波動,據報導造成了近萬億美元的股市波動。

與谷歌的專有方法不同,DeepSeek公開了其內部設定,供開發者本地實施。

儘管存在競爭,谷歌DeepMind的首席技術官Koray Kavukcuoglu仍然認為,專有模型在需要極高精確度的專業領域將保持優勢:"程式設計、數學和金融是模型需要非常準確、非常精確,並能理解真正複雜情況的情況。"

行業成熟的跡象

人工智慧推理控制的發展反映了一個現在正面對超越技術基準的實際侷限性的行業。儘管公司繼續推進推理能力,但谷歌的方法承認了一個重要現實:在商業應用中,效率與原始效能同樣重要。

這個功能還突顯了技術進步與可持續性關切之間的張力。追蹤推理模型效能的排行榜顯示,單個任務的完成成本可能高達200美元,這引發了在生產環境中擴充套件此類能力的疑問。

透過允許開發者根據實際需求調整推理的高低,谷歌同時解決了人工智慧部署的財務和環境方面。

"推理是構建智慧的關鍵能力,"Kavukcuoglu說,"當模型開始思考時,模型的主體性就已經開始了。"這個陳述揭示了推理模型的承諾和挑戰 - 它們的自主性創造了機遇,同時也帶來了資源管理挑戰。

對於部署人工智慧解決方案的組織來說,微調推理預算的能力可能會使獲取先進功能民主化,同時保持運營紀律。

谷歌聲稱Gemini 2.5 Flash以"僅為其他領先模型一小部分成本和規模"提供"可比的指標" - 這一價值主張因能夠為特定應用最佳化推理資源而得到加強。

實際implications

人工智慧推理控制功能具有直接的實際應用。構建商業應用的開發者現在可以在處理深度和運營成本之間做出明智的權衡。

對於像基本客戶查詢這樣的簡單應用,最小推理設定可以保留資源,同時仍然使用模型的功能。對於需要深入理解的複雜分析,完全推理能力仍然可用。

谷歌的推理"調節器"提供了一種建立成本確定性的機制,同時保持效能標準。

另請參閱:Gemini 2.5:谷歌烹飪出迄今最"智慧"的人工智慧模型

想要從行業領袖那裡瞭解更多關於人工智慧和大資料的資訊嗎?請檢視在阿姆斯特丹、加利福尼亞和倫敦舉行的人工智慧與大資料博覽會。這個全面的活動與其他領先活動同地舉辦,包括智慧自動化大會BlockX數字轉型周網路安全與雲展

探索由TechForge提供的其他即將到來的企業技術活動和網路研討會,請點選此處

本文最初發表於谷歌在Gemini 2.5 Flash中引入人工智慧推理控制,來源於人工智慧新聞

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
2
收藏
1
評論