Chainfeeds 导读:
硅谷正致力于将 AI 进化为「推理智能体」,而中国开源力量的崛起,正在打破这场技术进化的垄断格局。
文章来源:
https://x.com/nake13/status/2006027328766501223
文章作者:
Zhixiong Pan
观点:
Zhixiong Pan:1)Karpathy:2025 年 LLM 年度回顾。我们不是在「进化 / 培育动物」,而是在「召唤幽灵」。2)Google DeepMind:分布式 AGI 的安全性。AGI 并非一个实体,而是一种「事态」(state of affairs):一个成熟、去中心化的智能体经济体,其中人类的主要角色是编排与验证。3)OpenAI:前沿科学:评估 AI 执行专家级科学任务的能力。总体上,我们发现前沿 AI 系统在解决专家级推理问题方面进展迅速,尤其是在自包含的奥赛题上;但在研究风格任务上仍远未饱和。4)OpenAI:2025 年企业级人工智能现状。从「向模型索取输出」向「将复杂多步骤工作流委托给模型」的转变。5)OpenRouter & a16z :AI 现状:基于 OpenRouter 的一百万亿 Token 实证研究。领域的重心从单次前向的模式生成转向多步审慎推理式推断。6)Anthropic:AI 如何改变 Anthropic 的工作方式。Claude 是持续的协作者,但使用通常需要主动监督与验证,尤其是在高风险任务中;而不是把无需任何核验的任务直接交出去。7)DeepSeek‑V3.2:推动开源大语言模型前沿。DeepSeek‑V3.2 的表现可与 GPT‑5 相当。8)UC Berkeley / Stanford / IBM Research:生产环境中的智能体评估。可靠性仍然是当前最主要的开发挑战,其根源在于难以保证并评估智能体行为的正确性。9)Anthropic :AI 智能体发现 460 万美元区块链智能合约漏洞。有利可图的、真实世界的自主漏洞利用在技术上是可行的。10)DeepSeek‑OCR:上下文光学压缩。我们探索一种潜在解决方案:将视觉模态作为文本信息的高效压缩媒介。
内容来源





