亞馬遜仍被視為開發先進人工智慧的落後者,但它悄悄地建立了一個現在在人工智慧效能方面創造記錄的實驗室。亞馬遜位於舊金山的AGI SF實驗室致力於構建超越人類能力的人工通用智慧,今天揭示了其工作的首批成果:一個能夠支援一些最先進的AI代理的新AI模型。
亞馬遜表示,這個名為Amazon Nova Act的新模型在幾個旨在衡量AI代理智慧和能力的基準測試中,表現優於OpenAI和Anthropic的模型。在GroundUI Web和ScreenSpot基準測試中,Amazon Nova Act的表現優於Claude 3.7 Sonnet和OpenAI計算機使用代理。亞馬遜競爭人工智慧市場的主要計劃是專注於構建代理,新模型的能力反映了其努力構建能夠與現有最佳工具相媲美的一代工具。
"我相信未來計算的基本原子單位將是對巨型[AI]代理的呼叫,"領導亞馬遜AGI SF實驗室的大衛·盧安說。他曾是OpenAI的工程副總裁,後來共同創立了開拓AI代理工作的Adept創業公司,並在2024年亞馬遜收購該公司股份後加入亞馬遜。
大多數領先的AI實驗室現在都專注於構建越來越強大的AI代理。讓AI掌握獨立行動以及對話,有望使技術更加有用和有價值。然而,從聊天到行動的轉變仍然是一項正在進行的工作。
在過去的六個月裡,OpenAI、Anthropic、谷歌和其他公司展示了可以根據提示採取行動的網頁瀏覽代理。但在大多數情況下,這些代理仍然不可靠,很容易被開放式請求絆倒。
盧安表示,亞馬遜的目標是構建可靠而非華而不實的AI代理。阻礙代理發展的不是"需要更多60%有趣能力的酷炫演示",而是"Waymo問題",指自動駕駛汽車需要經過訓練以處理不尋常的邊緣情況,然後才能無人監督地行駛。
許多所謂的代理是透過將大型語言模型與多個人工編寫的規則相結合而構建的,這些規則旨在防止它們偏離軌道,但也使其行為變得脆弱。Amazon Nova Act是公司最強大的自研模型Amazon Nova的一個版本,經過額外訓練,可以幫助其決定採取什麼行動以及何時採取行動。盧安表示,總的來說,AI模型很難決定何時應該干預任務。
為了改進Nova的代理能力,亞馬遜正在使用強化學習,這種方法已幫助其他AI模型更好地模擬推理。
亞馬遜還從物理機器人中汲取靈感。盧安的團隊正在與亞馬遜另一個位於舊金山的團隊合作,該團隊由加州大學伯克利分校的皮特·阿貝爾教授領導,他致力於為機器人尋找人工智慧應用。阿貝爾是早期OpenAI員工,在2024年8月亞馬遜投資其創業公司Covariant後加入亞馬遜。鑑於亞馬遜在其履行中心已部署大量機器人,該公司很有可能在機器人技術方面取得進展。
Amazon Nova Act的釋出表明,亞馬遜可能成為建立有用軟體代理的黑馬。該公司對ChatGPT的響應較慢,但最近顯示出已經開始行動。今年2月,公司宣佈推出Alexa語音助手的新版本,具有改進的對話能力以及自動執行某些網頁任務的能力。
亞馬遜舉的一個用例是Alexa幫助預約維修壞掉的烤箱的服務。盧安表示,Alexa的新代理功能是由他的團隊開發的。
正如《連線》雜誌去年10月透露的,亞馬遜還研究了代理如何最終透過自動化查詢和購買商品來改善電子商務。亞馬遜的工程師表示,這樣的代理可能會根據使用者的興趣和習慣預先將商品新增到使用者的購物車中。
除了推出新模型外,亞馬遜今天還宣佈了一個軟體開發工具包(SDK),旨在讓計算機工程師更容易使用Amazon Nova Act構建軟體代理。該SDK允許開發者給代理特定指令,以幫助它們在為人類使用者設計的網際網路上導航。例如,在預訂租車時,可以指示代理"不接受保險追加銷售"。
最終,盧安表示,亞馬遜的代理應該變得足夠智慧,能夠自主避免追加銷售。"Nova Act確實是實現這一願景的第一步,"他說。




