本文为机器翻译
展示原文

伙计们,我觉得这可能是下一个 Openclaw。 Karpathy 让一个 AI 代理在两天内优化他自己的神经网路训练程式码。该代理自主运行了 700 次实验,发现了 Karpathy 经过数月手动调优后遗漏的 20 个改进点,性能提升了 11%。 该代理发现了漏洞,调整了超参数,发现了缺失的正则化,并根据先前的结果规划了自己的实验。 Karpathy 做了什么? “程式设计 program.md” 这个人20年来一直手工完成同样的工作流程,也参与了特斯拉自动驾驶系统的研发。他的反应是「疯狂的」。 为什么这是 OpenClaw 等级的? 因为 OpenClaw 并非一个机器人学习一项任务,而是一个框架,让智能体能够执行一整套动作。 同样的事情也发生在研究/实验本身。 Karpathy已经开始著手第二轮多智能体协作了。他直言不讳地说:“所有前沿实验室都会参与其中。这是最终决战。” 但从更宏观的角度来看,他的真正洞见是:“任何你关心的、评估起来相对高效的指标,都可以通过智能体群自动进行研究。” 任何你关心的、评估起来比较有效率的指标都可以由智能体群自动进行研究。 广告支出、供应链、能源网路、药物研发、交易策略等等……如果可以自动搜索,就会自动搜寻。 现在我们需要集群的基础设施。

Andrej Karpathy
@karpathy
03-10
Three days ago I left autoresearch tuning nanochat for ~2 days on depth=12 model. It found ~20 changes that improved the validation loss. I tested these changes yesterday and all of them were additive and transferred to larger (depth=24) models. Stacking up all of these changes,
相关赛道:
来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论