我使用人工智能完成所有节日购物

avatar
WIRED
2 天前
本文为机器翻译
展示原文

下一代生成式 AI 的承诺之一是,这项技术将具有代理性,即能够自主代表我们这些混乱的人类执行任务。这意味着 AI 代理理论上能够"推理"下一步应该采取的行动,从而能够从单一查询中执行多个操作。如果你相信这些炒作,可能性是无穷无尽的——想象最大效率和生产力,再加上科技巨头季度财报电话会议上可能听到的一系列充满噱头的措辞。不过,我只希望 AI 为我做一件事,那就是购物。

我知道有些人觉得购物是一种愉悦的行为,但无论是在实体店还是在无休止的滚动页面中,选择都让我不知所措。在12月节假日来临之际,压力更加增大:如何向某人传达你今年乃至多年来对他们的感激之情,并用比一支大豆蜡烛更有深意的东西来表达这种感激?我已经准备好让 AI 接管这个任务了。

在过去几周里,我将礼物购买外包给了 Perplexity AI、OpenAI 的 ChatGPT、Google 的 Gemini、Anthropic 的 Claude 和亚马逊的 Rufus,看看我是否终于可以将我最讨厌的任务之一委托给 AI。我将这些生成式 AI 机器人当作纯粹的工具;作为实现商业目的的手段。我放手让这些生成式 AI 机器人大展拳脚,并烧毁了地球,以寻找完美的烘焙设备。

剧透:我很快就发现,这些应用程序目前还无法自主购物。它们只是被美化了的搜索工具,能够解析和总结产品描述,并比较不同的商品。我仍然需要编写和重写提示,了解我正在寻找什么样的礼物,而且在大多数情况下,我也需要输入付款信息,并在每个零售商的网站上完成购买过程。

我使用这些机器人为5个人购物,年龄从6个月到49岁不等。一位热爱烘焙的好友成为我的主要测试对象之一。我还试图为我16岁的侄女想出节日礼物点子,她曾在短信中对我说"别担心,你还不算老"(我保存了这条截图)。我购物清单上的另一个人是一位编辑兼音乐家朋友,他在新年后不久就要庆祝一个重要的生日,品位很独特。

我测试的一款 AI 应用程序有一个专门为购物设计的功能。Perplexity AI 是一家资金充足的生成式 AI 搜索初创公司,因被指从新闻出版商那里抄袭内容而受到批评。上个月,Perplexity 推出了一项名为"Buy with Pro"的新服务,需要每月支付20美元的 Perplexity Pro 订阅费。"Buy with Pro"被描述为一种"前所未有的 AI 商务体验",承诺让在线购物"变得简单有趣10倍"。这立即让我觉得这是一种 AI 幻觉,因为在第一place,在线购物就不是一件有趣的事。(就披露而言,Buy with Pro 和其他 AI 礼品指南在技术上也是与 WIRED 竞争对手,WIRED 从我们完全由人类制作、人类审核和人类编辑的礼品指南中获得联盟收入。)

当你在 Perplexity Pro 上运行与购物相关的查询时,该应用程序会显示它正在"阅读"来自《纽约时报》、《美食频道》、Reddit 等的来源。几秒钟后,它会呈现出一系列产品,包括价格和零售商。其中一些列表现在有购买按钮,由 Shopify 或 Perplexity 自己的支付处理服务提供支持。如果你点击并下单购买,运费是免费的。Perplexity 应用程序内还有一个视觉搜索工具,可以让你拍摄物品照片,并在线搜索类似的商品。(Perplexity 表示,它不会从通过其平台进行的销售中获得联盟收入。)

我尝试在 Perplexity Pro 上搜索"适合热爱烘焙但已经拥有一切的亲密朋友的理想节日礼物"。AI 给出的列表大多属于我会描述为低俗无用的批准矩阵范畴,偶尔也有一些出色的建议。它包括一个10美元的 Tasty Tinies 儿童迷你烘焙套装(不适用)、一个120美元的 Bakken-Swiss 可堆叠8件套烘焙套装(可能有用)以及一件35美元印有"My Buns Are Gluten-Free"字样的运动衫(完全不行)。稍微调整提示,加入"奢华"或"定制"等词,输出结果略有改善,但并不太多。

使用 Perplexity 的购物功能很快就开始感觉与浏览亚马逊或沃尔玛网站——或者可能是一个产品评论网站——没有太大区别,只是被包裹在一个 C-3PO 式的"让我为你计算"的外壳中。亚马逊的 Rufus AI 也在亚马逊网站和移动应用程序上提供这种服务,那里有一个机器人可以回答问题、比较产品,并帮助你从亚马逊上购买更多垃圾。当我向 Rufus 提出同样的烘焙礼物提示时,它立即建议我为朋友购买一台价格超过300美元的 KitchenAid 立式搅拌机。(Rufus 似乎认为你有贝佐斯那么多钱。)

然后我转向另外三个 AI 聊天机器人,它们都没有独立的电子商务功能。但 ChatGPT 等工具的主要卖点之一是,它们应该能够帮助人们进行头脑风暴和产生创意——这正是我所需要的。

当我问同样的问题,即要为热爱烘焙的朋友买什么礼物时,ChatGPT 的回答最为周到和富有创意。它提供了15个不同的礼物建议,分为烘焙主题礼物、奢华家居用品和个性化等几个类别。手工制作的陶瓷搅拌碗?配合烘焙食品的优质茶或咖啡采样?记录烘焙历程的食谱日记?这些都是很棒的建议。

在最初的回应中,ChatGPT 没有提供任何产品链接。但当我询问时,它很容易提供了链接,而且我没有点击每一个链接,但似乎都不是幻觉。另一方面,Claude 道歉说它"无法直接链接到网站或产品"。Anthropic 尚未为 Claude 发布网络搜索功能,但该公司表示正在研发中。

这在技术上使 Claude 成为我测试中最不实用的聊天机器人。但这也意味着 Anthropic 到目前为止一直避免陷入允许其 AI 聊天机器人从网络上抓取人类撰写的产品评论这种道德上模糊的领域。相反,Claude 是基于其现有的数据集进行产品比较的。而 Perplexity 则表示,有了"Buy with Pro",人们"不再需要滚动浏览无数的产品评论"。

当我问 Perplexity 我应该为我的编辑/音乐家朋友买什么时,它推荐了一套太阳能自行车灯(我还注意到他是个骑自行车的人)。这不是一个坏主意,但也不太适合庆祝重要生日。我继续调整提示。那么一个定制的皮革吉他背带怎么样?我一头扎进了兔子洞。

我开始理解,Perplexity 在炒作其购物功能的目标,不仅仅是帮助我进行头脑风暴,找到非常周到的礼物。Perplexity 在玩一个长远的游戏,慢慢地吸引我们的注意力远离网络的其他角落,更好地了解像我这样的人如何使用其平台,并将这些数据输入到其不断发展的 AI 模型中。每当我需要修改搜索,因为初始结果往往缺乏时,我都会留在 Perplexity 的应用程序中,这意味着我不在亚马逊和谷歌(尽管最终我还是访问了这两个网站)。Perplexity Pro 还不是一个成熟的电子商务网站,也还没有任何真正的"代理"能力,但我是数百万人中的一员,为它提供了成为这些东西所需的信息。

当我转向 Google 的 Gemini 时,我发现它为我的16岁侄女推荐的礼物并不算太差,只是缺乏创意,而且在一个例子中还让人困惑。它说我应该给她买一条"可以和一本好书一起舒适地蜷缩的猫毯",但不清楚这条毯子是给她还是给她的猫用的。Kindle 是个不错的主意。但如果我给她寄一本 SAT 备考书,我很害怕她会给我发一条什么样的短信(可能只是"谢谢",什么也不说)。该应用程序为我的编辑/音乐家朋友提出的建议同样乏味,其中包括"黑胶唱片"和"高品质耳机"。

我使用的是一年前推出的Gemini 版本,但本月早些时候,谷歌开始向开发者和有限的测试人员推出新版本 Gemini 2.0。新的 AI 模型将"提前多步思考,并代表你采取行动",该公司表示。目前,这意味着代表开发者采取行动——执行他们编码工作流程的下一步,但我迫不及待地等待着它能够为我的购物清单铺平道路的那一天。

最终,ChatGPT 引导我找到了一家在线香料店,我为我的朋友(此时我已经在心中把她塑造成了《英国烘焙大师》的决赛选手)购买了一些特色烘焙原料。最后,我与这些 AI 机器人聊天了很长时间,以至于许多礼物都要到圣诞节后才能送到。我的侄女会收到一张附有现金的贺卡。我为朋友的重要生日寻找礼物的努力以失败告终。我决定把这个任务推迟到1月,那是一个充满新鲜感和代理决心的月份。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
1
收藏
评论