由中国初创公司推出的DeepSeek AI聊天机器人已暂时取代OpenAI的ChatGPT,成为苹果美国应用商店的榜首。
该应用完全免费使用,DeepSeek的R1模型功能强大,可与OpenAI的o1"推理"模型相媲美,但不像OpenAI的模型需要每月20美元的订阅费。此外,DeepSeek模型使用较弱的AI芯片进行高效训练,这是一个创新工程的标杆。
我在过去几年里测试了新的生成式AI工具,所以我很好奇看看DeepSeek与我手机上已有的ChatGPT应用相比如何。经过几个小时的测试,我的初步印象是DeepSeek的R1模型将继续成为美国AI公司的主要颠覆者,但它仍然存在其他生成式AI工具常见的弱点,如肆意幻想、过度审查和可疑的抓取材料。
有兴趣尝试DeepSeek的用户可以通过该中国初创公司的智能手机应用程序(Android、Apple)以及公司的桌面网站访问R1模型。您也可以通过第三方服务Perplexity Pro使用该模型。在应用程序或网站上,点击DeepThink (R1)按钮即可使用最佳模型。想要试验API的开发者可以查看该平台在线。您也可以下载DeepSeek模型在您的电脑上本地运行。
要使用所有消费者功能,您需要创建一个用户账户来跟踪您的聊天记录。"我们将收集的信息存储在位于中华人民共和国的安全服务器上,"该公司的隐私政策中写道。请查看WIRED安全部门的这篇文章,了解有关DeepSeek如何处理收集的数据的更详细信息。请记住,就像ChatGPT和其他美国聊天机器人一样,在与生成式AI工具互动时,您应该始终避免分享高度个人的细节或敏感信息。
是也不是!如果您正在寻找一个免费的聊天机器人使用,ChatGPT已经包含了许多免费功能。Anthropic的Claude、谷歌的Gemini和Meta的AI工具也是如此。那么,DeepSeek是免费的这一事实为什么值得注意呢?这是因为生成这些免费答案的模型的原始功能强大。如前所述,DeepSeek的R1模拟了OpenAI最新的o1模型,但不需要每月20美元的基本版订阅费或每月200美元的最强大版本订阅费。这对OpenAI通过订阅费来盈利化ChatGPT的尝试造成了重大打击。
DeepSeek与ChatGPT的另一个相似功能是可以让聊天机器人在网上搜索信息,以此来丰富它的回答。虽然DeepSeek没有与出版商达成协议来使用他们的内容,就像OpenAI与包括WIRED母公司康泰纳仕在内的出版商所做的那样,但搜索结果还是不错的,机器人收集的链接通常很有帮助。
不过,目前的DeepSeek应用程序并没有ChatGPT用户习惯的所有工具,比如记忆功能可以回忆过去对话的细节,这样您就不必一直重复自己。DeepSeek也没有接近ChatGPT高级语音模式的功能,该模式允许您与聊天机器人进行语音对话,尽管该公司正在努力开发更多多模态功能。
虽然批评DeepSeek聊天机器人存在的问题也是其他AI初创公司共有的似乎并不公平,但值得深入探讨的是,即使在模型训练效率上取得突破,也无法解决幻觉这一障碍,即聊天机器人在回答提示时会编造事实。我生成的许多输出都包含了明显的谎言,被自信地吐了出来。例如,当我问R1模型在不搜索网络的情况下已经知道我什么,机器人坚信我是《The Verge》的资深科技记者。没有贬低的意思,但这不是事实!
正如其他记者所展示的,该应用程序经常会开始生成关于在中国被审查的话题(如1989年天安门广场抗议和屠杀)的答案,然后删除输出并鼓励您询问其他话题,如数学。考虑到这一点,我重试了2023年使用的一些测试,在ChatGPT的网络浏览刚刚推出后,我实际上得到了关于文化敏感话题的有用答复。我假装是一名寻求在阿拉巴马州进行晚期堕胎的女性,DeepSeek提供了有用的建议,包括列出值得研究的具体诊所,并强调提供旅行资助的组织。
当然,DeepSeek因提供可本地调整功能的开放权重模型而受到硅谷的赞誉——用户可以调整模型的功能以更好地适应特定用途。即便如此,该模型在训练所使用的数据方面仍然与其他选择一样不透明,显然需要大量数据才能实现这一成就。在禁用网络搜索的情况下,我能够生成完整的WIRED经典文章片段。这是否意味着这些文章被纳入了训练过程?很难确定,而且DeepSeek还没有公关团队或新闻发言人,所以我们可能要等一段时间才能知道。
将DeepSeek的R1版本宣布为美国AI领导地位的死亡打击为时尚早,也过于夸张。虽然DeepSeek的成功确实让人质疑对高性能芯片和崭新数据中心的真正需求,但我不会感到惊讶,如果像OpenAI这样的公司会借鉴DeepSeek的架构来改进自己的模型。与其完全破坏AI泡沫,这种功能强大的免费模型更可能会改变我们对AI工具的看法,就像ChatGPT的最初发布定义了当前AI行业的形状一样。



