下一代生成式 AI 的承諾之一是,這項技術將具有代理性,即能夠自主代表我們這些混亂的人類執行任務。這意味著 AI 代理理論上能夠"推理"下一步應該採取的行動,從而能夠從單一查詢中執行多個操作。如果你相信這些炒作,可能性是無窮無盡的——想象最大效率和生產力,再加上科技巨頭季度財報電話會議上可能聽到的一系列充滿噱頭的措辭。不過,我只希望 AI 為我做一件事,那就是購物。
我知道有些人覺得購物是一種愉悅的行為,但無論是在實體店還是在無休止的滾動頁面中,選擇都讓我不知所措。在12月節假日來臨之際,壓力更加增大:如何向某人傳達你今年乃至多年來對他們的感激之情,並用比一支大豆蠟燭更有深意的東西來表達這種感激?我已經準備好讓 AI 接管這個任務了。
在過去幾周裡,我將禮物購買外包給了 Perplexity AI、OpenAI 的 ChatGPT、Google 的 Gemini、Anthropic 的 Claude 和亞馬遜的 Rufus,看看我是否終於可以將我最討厭的任務之一委託給 AI。我將這些生成式 AI 機器人當作純粹的工具;作為實現商業目的的手段。我放手讓這些生成式 AI 機器人大展拳腳,並燒燬了地球,以尋找完美的烘焙裝置。
劇透:我很快就發現,這些應用程式目前還無法自主購物。它們只是被美化了的搜尋工具,能夠解析和總結產品描述,並比較不同的商品。我仍然需要編寫和重寫提示,瞭解我正在尋找什麼樣的禮物,而且在大多數情況下,我也需要輸入付款資訊,並在每個零售商的網站上完成購買過程。
我使用這些機器人為5個人購物,年齡從6個月到49歲不等。一位熱愛烘焙的好友成為我的主要測試物件之一。我還試圖為我16歲的侄女想出節日禮物點子,她曾在簡訊中對我說"別擔心,你還不算老"(我儲存了這條截圖)。我購物清單上的另一個人是一位編輯兼音樂家朋友,他在新年後不久就要慶祝一個重要的生日,品位很獨特。
我測試的一款 AI 應用程式有一個專門為購物設計的功能。Perplexity AI 是一家資金充足的生成式 AI 搜尋初創公司,因被指從新聞出版商那裡抄襲內容而受到批評。上個月,Perplexity 推出了一項名為"Buy with Pro"的新服務,需要每月支付20美元的 Perplexity Pro 訂閱費。"Buy with Pro"被描述為一種"前所未有的 AI 商務體驗",承諾讓線上購物"變得簡單有趣10倍"。這立即讓我覺得這是一種 AI 幻覺,因為在第一place,線上購物就不是一件有趣的事。(就披露而言,Buy with Pro 和其他 AI 禮品指南在技術上也是與 WIRED 競爭對手,WIRED 從我們完全由人類製作、人類稽核和人類編輯的禮品指南中獲得聯盟收入。)
當你在 Perplexity Pro 上執行與購物相關的查詢時,該應用程式會顯示它正在"閱讀"來自《紐約時報》、《美食頻道》、Reddit 等的來源。幾秒鐘後,它會呈現出一系列產品,包括價格和零售商。其中一些列表現在有購買按鈕,由 Shopify 或 Perplexity 自己的支付處理服務提供支援。如果你點選並下單購買,運費是免費的。Perplexity 應用程式內還有一個視覺搜尋工具,可以讓你拍攝物品照片,並在線搜尋類似的商品。(Perplexity 表示,它不會從透過其平臺進行的銷售中獲得聯盟收入。)
我嘗試在 Perplexity Pro 上搜索"適合熱愛烘焙但已經擁有一切的親密朋友的理想節日禮物"。AI 給出的列表大多屬於我會描述為低俗無用的批准矩陣範疇,偶爾也有一些出色的建議。它包括一個10美元的 Tasty Tinies 兒童迷你烘焙套裝(不適用)、一個120美元的 Bakken-Swiss 可堆疊8件套烘焙套裝(可能有用)以及一件35美元印有"My Buns Are Gluten-Free"字樣的運動衫(完全不行)。稍微調整提示,加入"奢華"或"定製"等詞,輸出結果略有改善,但並不太多。
使用 Perplexity 的購物功能很快就開始感覺與瀏覽亞馬遜或沃爾瑪網站——或者可能是一個產品評論網站——沒有太大區別,只是被包裹在一個 C-3PO 式的"讓我為你計算"的外殼中。亞馬遜的 Rufus AI 也在亞馬遜網站和移動應用程式上提供這種服務,那裡有一個機器人可以回答問題、比較產品,並幫助你從亞馬遜上購買更多垃圾。當我向 Rufus 提出同樣的烘焙禮物提示時,它立即建議我為朋友購買一臺價格超過300美元的 KitchenAid 立式攪拌機。(Rufus 似乎認為你有貝佐斯那麼多錢。)
然後我轉向另外三個 AI 聊天機器人,它們都沒有獨立的電子商務功能。但 ChatGPT 等工具的主要賣點之一是,它們應該能夠幫助人們進行頭腦風暴和產生創意——這正是我所需要的。
當我問同樣的問題,即要為熱愛烘焙的朋友買什麼禮物時,ChatGPT 的回答最為周到和富有創意。它提供了15個不同的禮物建議,分為烘焙主題禮物、奢華家居用品和個性化等幾個類別。手工製作的陶瓷攪拌碗?配合烘焙食品的優質茶或咖啡取樣?記錄烘焙歷程的食譜日記?這些都是很棒的建議。
在最初的回應中,ChatGPT 沒有提供任何產品連結。但當我詢問時,它很容易提供了連結,而且我沒有點選每一個連結,但似乎都不是幻覺。另一方面,Claude 道歉說它"無法直接連結到網站或產品"。Anthropic 尚未為 Claude 釋出網路搜尋功能,但該公司表示正在研發中。
這在技術上使 Claude 成為我測試中最不實用的聊天機器人。但這也意味著 Anthropic 到目前為止一直避免陷入允許其 AI 聊天機器人從網路上抓取人類撰寫的產品評論這種道德上模糊的領域。相反,Claude 是基於其現有的資料集進行產品比較的。而 Perplexity 則表示,有了"Buy with Pro",人們"不再需要滾動瀏覽無數的產品評論"。
當我問 Perplexity 我應該為我的編輯/音樂家朋友買什麼時,它推薦了一套太陽能腳踏車燈(我還注意到他是個騎腳踏車的人)。這不是一個壞主意,但也不太適合慶祝重要生日。我繼續調整提示。那麼一個定製的皮革吉他揹帶怎麼樣?我一頭扎進了兔子洞。
我開始理解,Perplexity 在炒作其購物功能的目標,不僅僅是幫助我進行頭腦風暴,找到非常周到的禮物。Perplexity 在玩一個長遠的遊戲,慢慢地吸引我們的注意力遠離網路的其他角落,更好地瞭解像我這樣的人如何使用其平臺,並將這些資料輸入到其不斷發展的 AI 模型中。每當我需要修改搜尋,因為初始結果往往缺乏時,我都會留在 Perplexity 的應用程式中,這意味著我不在亞馬遜和谷歌(儘管最終我還是訪問了這兩個網站)。Perplexity Pro 還不是一個成熟的電子商務網站,也還沒有任何真正的"代理"能力,但我是數百萬人中的一員,為它提供了成為這些東西所需的資訊。
當我轉向 Google 的 Gemini 時,我發現它為我的16歲侄女推薦的禮物並不算太差,只是缺乏創意,而且在一個例子中還讓人困惑。它說我應該給她買一條"可以和一本好書一起舒適地蜷縮的貓毯",但不清楚這條毯子是給她還是給她的貓用的。Kindle 是個不錯的主意。但如果我給她寄一本 SAT 備考書,我很害怕她會給我發一條什麼樣的簡訊(可能只是"謝謝",什麼也不說)。該應用程式為我的編輯/音樂家朋友提出的建議同樣乏味,其中包括"黑膠唱片"和"高品質耳機"。
我使用的是一年前推出的Gemini 版本,但本月早些時候,谷歌開始向開發者和有限的測試人員推出新版本 Gemini 2.0。新的 AI 模型將"提前多步思考,並代表你採取行動",該公司表示。目前,這意味著代表開發者採取行動——執行他們編碼工作流程的下一步,但我迫不及待地等待著它能夠為我的購物清單鋪平道路的那一天。
最終,ChatGPT 引導我找到了一家線上香料店,我為我的朋友(此時我已經在心中把她塑造成了《英國烘焙大師》的決賽選手)購買了一些特色烘焙原料。最後,我與這些 AI 機器人聊天了很長時間,以至於許多禮物都要到聖誕節後才能送到。我的侄女會收到一張附有現金的賀卡。我為朋友的重要生日尋找禮物的努力以失敗告終。我決定把這個任務推遲到1月,那是一個充滿新鮮感和代理決心的月份。