【長推】2025 的 AI 行業太吵了，我只摘出了這 10 句話作為年度總結

Chainfeeds

12-31

Chainfeeds 導讀：

硅谷正致力於將 AI 進化為「推理智能體」，而中國開源力量的崛起，正在打破這場技術進化的壟斷格局。

文章來源：

https://x.com/nake13/status/2006027328766501223

文章作者：

Zhixiong Pan

觀點：

Zhixiong Pan：1）Karpathy：2025 年 LLM 年度回顧。我們不是在「進化 / 培育動物」，而是在「召喚幽靈」。2）Google DeepMind：分佈式 AGI 的安全性。AGI 並非一個實體，而是一種「事態」（state of affairs）：一個成熟、去中心化的智能體經濟體，其中人類的主要角色是編排與驗證。3）OpenAI：前沿科學：評估 AI 執行專家級科學任務的能力。總體上，我們發現前沿 AI 系統在解決專家級推理問題方面進展迅速，尤其是在自包含的奧賽題上；但在研究風格任務上仍遠未飽和。4）OpenAI：2025 年企業級人工智能現狀。從「向模型索取輸出」向「將複雜多步驟工作流委託給模型」的轉變。5）OpenRouter & a16z ：AI 現狀：基於 OpenRouter 的一百萬億 Token 實證研究。領域的重心從單次前向的模式生成轉向多步審慎推理式推斷。6）Anthropic：AI 如何改變 Anthropic 的工作方式。Claude 是持續的協作者，但使用通常需要主動監督與驗證，尤其是在高風險任務中；而不是把無需任何核驗的任務直接交出去。7）DeepSeek‑V3.2：推動開源大語言模型前沿。DeepSeek‑V3.2 的表現可與 GPT‑5 相當。8）UC Berkeley / Stanford / IBM Research：生產環境中的智能體評估。可靠性仍然是當前最主要的開發挑戰，其根源在於難以保證並評估智能體行為的正確性。9）Anthropic ：AI 智能體發現 460 萬美元區塊鏈智能合約漏洞。有利可圖的、真實世界的自主漏洞利用在技術上是可行的。10）DeepSeek‑OCR：上下文光學壓縮。我們探索一種潛在解決方案：將視覺模態作為文本信息的高效壓縮媒介。

內容來源

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論