@polymath_labs 正在訓練世界生成模型,以實現 RL 環境的自動化創建。 傳統上,強化學習環境的生成一直受限於人類提供的數據。僅靠人類提供的數據永遠無法實現超級智能。 Polymath正在構建核心技術,以實現自動化環境生成,所需人力遠少於傳統方式,最終甚至無需人力。 這將帶來更復雜、更逼真的世界,以及更高質量、更大規模和更多樣化的任務。這對解鎖強化學習的規模化至關重要。 最終目標是僅通過文本描述創建大規模、長遠視角的環境。 這將使創建任意複雜度和規模的世界成為可能,這是訓練和評估自主、超級智能人工智能代理的基礎。 恭喜 @dylanma5621 和 @narenyenuganti 的發佈! ycombinator.com/launches/PYT-p...…
本文為機器翻譯
展示原文
來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享
