kydo🫡的想法

03-11

本文為機器翻譯

展示原文

夥計們，我覺得這可能是下一個 Openclaw。 Karpathy 讓一個 AI 代理在兩天內優化他自己的神經網路訓練程式碼。該代理自主運行了 700 次實驗，發現了 Karpathy 經過數月手動調優後遺漏的 20 個改進點，性能提升了 11%。該代理發現了漏洞，調整了超參數，發現了缺失的正則化，並根據先前的結果規劃了自己的實驗。 Karpathy 做了什麼？ “程式設計 program.md” 這個人20年來一直手工完成同樣的工作流程，也參與了特斯拉自動駕駛系統的研發。他的反應是「瘋狂的」。為什麼這是 OpenClaw 等級的？因為 OpenClaw 並非一個機器人學習一項任務，而是一個框架，讓智能體能夠執行一整套動作。同樣的事情也發生在研究/實驗本身。 Karpathy已經開始著手第二輪多智能體協作了。他直言不諱地說：“所有前沿實驗室都會參與其中。這是最終決戰。” 但從更宏觀的角度來看，他的真正洞見是：“任何你關心的、評估起來相對高效的指標，都可以通過智能體群自動進行研究。” 任何你關心的、評估起來比較有效率的指標都可以由智能體群自動進行研究。廣告支出、供應鏈、能源網路、藥物研發、交易策略等等……如果可以自動搜索，就會自動搜尋。現在我們需要集群的基礎設施。

Andrej Karpathy

@karpathy

03-10

Three days ago I left autoresearch tuning nanochat for ~2 days on depth=12 model. It found ~20 changes that improved the validation loss. I tested these changes yesterday and all of them were additive and transferred to larger (depth=24) models. Stacking up all of these changes,