kydo🫡的想法

03-11

本文为机器翻译

展示原文

伙计们，我觉得这可能是下一个 Openclaw。 Karpathy 让一个 AI 代理在两天内优化他自己的神经网路训练程式码。该代理自主运行了 700 次实验，发现了 Karpathy 经过数月手动调优后遗漏的 20 个改进点，性能提升了 11%。该代理发现了漏洞，调整了超参数，发现了缺失的正则化，并根据先前的结果规划了自己的实验。 Karpathy 做了什么？ “程式设计 program.md” 这个人20年来一直手工完成同样的工作流程，也参与了特斯拉自动驾驶系统的研发。他的反应是「疯狂的」。为什么这是 OpenClaw 等级的？因为 OpenClaw 并非一个机器人学习一项任务，而是一个框架，让智能体能够执行一整套动作。同样的事情也发生在研究/实验本身。 Karpathy已经开始著手第二轮多智能体协作了。他直言不讳地说：“所有前沿实验室都会参与其中。这是最终决战。” 但从更宏观的角度来看，他的真正洞见是：“任何你关心的、评估起来相对高效的指标，都可以通过智能体群自动进行研究。” 任何你关心的、评估起来比较有效率的指标都可以由智能体群自动进行研究。广告支出、供应链、能源网路、药物研发、交易策略等等……如果可以自动搜索，就会自动搜寻。现在我们需要集群的基础设施。

Andrej Karpathy

@karpathy

03-10

Three days ago I left autoresearch tuning nanochat for ~2 days on depth=12 model. It found ~20 changes that improved the validation loss. I tested these changes yesterday and all of them were additive and transferred to larger (depth=24) models. Stacking up all of these changes,