夥計們,我覺得這可能是下一個 Openclaw。 Karpathy 讓一個 AI 代理在兩天內優化他自己的神經網路訓練程式碼。該代理自主運行了 700 次實驗,發現了 Karpathy 經過數月手動調優後遺漏的 20 個改進點,性能提升了 11%。 該代理發現了漏洞,調整了超參數,發現了缺失的正則化,並根據先前的結果規劃了自己的實驗。 Karpathy 做了什麼? “程式設計 program.md” 這個人20年來一直手工完成同樣的工作流程,也參與了特斯拉自動駕駛系統的研發。他的反應是「瘋狂的」。 為什麼這是 OpenClaw 等級的? 因為 OpenClaw 並非一個機器人學習一項任務,而是一個框架,讓智能體能夠執行一整套動作。 同樣的事情也發生在研究/實驗本身。 Karpathy已經開始著手第二輪多智能體協作了。他直言不諱地說:“所有前沿實驗室都會參與其中。這是最終決戰。” 但從更宏觀的角度來看,他的真正洞見是:“任何你關心的、評估起來相對高效的指標,都可以通過智能體群自動進行研究。” 任何你關心的、評估起來比較有效率的指標都可以由智能體群自動進行研究。 廣告支出、供應鏈、能源網路、藥物研發、交易策略等等……如果可以自動搜索,就會自動搜尋。 現在我們需要集群的基礎設施。
本文為機器翻譯
展示原文

Andrej Karpathy
@karpathy
03-10
Three days ago I left autoresearch tuning nanochat for ~2 days on depth=12 model. It found ~20 changes that improved the validation loss. I tested these changes yesterday and all of them were additive and transferred to larger (depth=24) models. Stacking up all of these changes,

相关赛道:
來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享




