被 Karpathy 的 autoresearch 啟發,我讓 VibeHQ 學會了自我進化,不是進化單一 agent,是進化整個Multi Agents的合作方式。
7 次全自動運行,零人工介入:
• Token 用量:7.2M → 5.7M(峰值降 62%)
• 協調相關問題降低 (重複工作等情況發生...):4 → 0
• PM token 浪費:-91%
迴圈: benchmark → 合作量化以及 LLM 分析失敗模式 → /optimize-protocol 重寫協調 code → rebuild → repeat。
AI自己看著 agents 團隊合作失敗,自己分析為什麼失敗,然後自己改自己的 source code 來協調合作邏輯,全程零人工,完全讓AI來自己組織自己的團隊默契。
看了一下相關的東西,autoresearch 在自動優化Model的訓練,之前的 Ralph 是單 agent 的自主迴圈,Gastown 同時跑 20-30 個 Claude Code 做
orchestration 但並沒有進化的能力,這些都很猛,不過到後面也都在進化單一 agent 的能力。
沒人在進化團隊合作本身,怎麼分工、怎麼避免衝突、怎麼共享 context、怎麼互相 unblock,跟真實世界一樣,AI team 也是需要磨合的。
想像一下這東西跑下去會變什麼:
• Agents 自己發展出團隊文化跟工作默契。
• 按項目進行自適應,依據項目開發程度來分配 3 人 team 或是 7 人 team 。
• 越多項目一起做,團隊越強。
• Agents 可以在項目進行中 onboard 新隊友,自動重新分配工作。
說真的,最後會進化成什麼?我也不知道,但這反而是最讓人興奮的部分。

Andrej Karpathy
@karpathy
03-10
Three days ago I left autoresearch tuning nanochat for ~2 days on depth=12 model. It found ~20 changes that improved the validation loss. I tested these changes yesterday and all of them were additive and transferred to larger (depth=24) models. Stacking up all of these changes,


詳細實驗數據結果可看這篇
來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享





