@polymath_labs 正在训练世界生成模型,以实现 RL 环境的自动化创建。 传统上,强化学习环境的生成一直受限于人类提供的数据。仅靠人类提供的数据永远无法实现超级智能。 Polymath正在构建核心技术,以实现自动化环境生成,所需人力远少于传统方式,最终甚至无需人力。 这将带来更复杂、更逼真的世界,以及更高质量、更大规模和更多样化的任务。这对解锁强化学习的规模化至关重要。 最终目标是仅通过文本描述创建大规模、长远视角的环境。 这将使创建任意复杂度和规模的世界成为可能,这是训练和评估自主、超级智能人工智能代理的基础。 恭喜 @dylanma5621 和 @narenyenuganti 的发布! ycombinator.com/launches/PYT-p...…
本文为机器翻译
展示原文
来自推特
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论
分享
