Chainfeeds 導讀:
硅谷正致力於將 AI 進化為「推理智能體」,而中國開源力量的崛起,正在打破這場技術進化的壟斷格局。
文章來源:
https://x.com/nake13/status/2006027328766501223
文章作者:
Zhixiong Pan
觀點:
Zhixiong Pan:1)Karpathy:2025 年 LLM 年度回顧。我們不是在「進化 / 培育動物」,而是在「召喚幽靈」。2)Google DeepMind:分佈式 AGI 的安全性。AGI 並非一個實體,而是一種「事態」(state of affairs):一個成熟、去中心化的智能體經濟體,其中人類的主要角色是編排與驗證。3)OpenAI:前沿科學:評估 AI 執行專家級科學任務的能力。總體上,我們發現前沿 AI 系統在解決專家級推理問題方面進展迅速,尤其是在自包含的奧賽題上;但在研究風格任務上仍遠未飽和。4)OpenAI:2025 年企業級人工智能現狀。從「向模型索取輸出」向「將複雜多步驟工作流委託給模型」的轉變。5)OpenRouter & a16z :AI 現狀:基於 OpenRouter 的一百萬億 Token 實證研究。領域的重心從單次前向的模式生成轉向多步審慎推理式推斷。6)Anthropic:AI 如何改變 Anthropic 的工作方式。Claude 是持續的協作者,但使用通常需要主動監督與驗證,尤其是在高風險任務中;而不是把無需任何核驗的任務直接交出去。7)DeepSeek‑V3.2:推動開源大語言模型前沿。DeepSeek‑V3.2 的表現可與 GPT‑5 相當。8)UC Berkeley / Stanford / IBM Research:生產環境中的智能體評估。可靠性仍然是當前最主要的開發挑戰,其根源在於難以保證並評估智能體行為的正確性。9)Anthropic :AI 智能體發現 460 萬美元區塊鏈智能合約漏洞。有利可圖的、真實世界的自主漏洞利用在技術上是可行的。10)DeepSeek‑OCR:上下文光學壓縮。我們探索一種潛在解決方案:將視覺模態作為文本信息的高效壓縮媒介。
內容來源





