亚马逊仍被视为开发先进人工智能的落后者,但它悄悄地建立了一个现在在人工智能性能方面创造记录的实验室。亚马逊位于旧金山的AGI SF实验室致力于构建超越人类能力的人工通用智能,今天揭示了其工作的首批成果:一个能够支持一些最先进的AI代理的新AI模型。
亚马逊表示,这个名为Amazon Nova Act的新模型在几个旨在衡量AI代理智能和能力的基准测试中,表现优于OpenAI和Anthropic的模型。在GroundUI Web和ScreenSpot基准测试中,Amazon Nova Act的表现优于Claude 3.7 Sonnet和OpenAI计算机使用代理。亚马逊竞争人工智能市场的主要计划是专注于构建代理,新模型的能力反映了其努力构建能够与现有最佳工具相媲美的一代工具。
"我相信未来计算的基本原子单位将是对巨型[AI]代理的调用,"领导亚马逊AGI SF实验室的大卫·卢安说。他曾是OpenAI的工程副总裁,后来共同创立了开拓AI代理工作的Adept创业公司,并在2024年亚马逊收购该公司股份后加入亚马逊。
大多数领先的AI实验室现在都专注于构建越来越强大的AI代理。让AI掌握独立行动以及对话,有望使技术更加有用和有价值。然而,从聊天到行动的转变仍然是一项正在进行的工作。
在过去的六个月里,OpenAI、Anthropic、谷歌和其他公司展示了可以根据提示采取行动的网页浏览代理。但在大多数情况下,这些代理仍然不可靠,很容易被开放式请求绊倒。
卢安表示,亚马逊的目标是构建可靠而非华而不实的AI代理。阻碍代理发展的不是"需要更多60%有趣能力的酷炫演示",而是"Waymo问题",指自动驾驶汽车需要经过训练以处理不寻常的边缘情况,然后才能无人监督地行驶。
许多所谓的代理是通过将大型语言模型与多个人工编写的规则相结合而构建的,这些规则旨在防止它们偏离轨道,但也使其行为变得脆弱。Amazon Nova Act是公司最强大的自研模型Amazon Nova的一个版本,经过额外训练,可以帮助其决定采取什么行动以及何时采取行动。卢安表示,总的来说,AI模型很难决定何时应该干预任务。
为了改进Nova的代理能力,亚马逊正在使用强化学习,这种方法已帮助其他AI模型更好地模拟推理。
亚马逊还从物理机器人中汲取灵感。卢安的团队正在与亚马逊另一个位于旧金山的团队合作,该团队由加州大学伯克利分校的皮特·阿贝尔教授领导,他致力于为机器人寻找人工智能应用。阿贝尔是早期OpenAI员工,在2024年8月亚马逊投资其创业公司Covariant后加入亚马逊。鉴于亚马逊在其履行中心已部署大量机器人,该公司很有可能在机器人技术方面取得进展。
Amazon Nova Act的发布表明,亚马逊可能成为创建有用软件代理的黑马。该公司对ChatGPT的响应较慢,但最近显示出已经开始行动。今年2月,公司宣布推出Alexa语音助手的新版本,具有改进的对话能力以及自动执行某些网页任务的能力。
亚马逊举的一个用例是Alexa帮助预约维修坏掉的烤箱的服务。卢安表示,Alexa的新代理功能是由他的团队开发的。
正如《连线》杂志去年10月透露的,亚马逊还研究了代理如何最终通过自动化查找和购买商品来改善电子商务。亚马逊的工程师表示,这样的代理可能会根据用户的兴趣和习惯预先将商品添加到用户的购物车中。
除了推出新模型外,亚马逊今天还宣布了一个软件开发工具包(SDK),旨在让计算机工程师更容易使用Amazon Nova Act构建软件代理。该SDK允许开发者给代理特定指令,以帮助它们在为人类用户设计的互联网上导航。例如,在预订租车时,可以指示代理"不接受保险追加销售"。
最终,卢安表示,亚马逊的代理应该变得足够智能,能够自主避免追加销售。"Nova Act确实是实现这一愿景的第一步,"他说。




