机器中的障碍:OpenAI 的 GPT-5 推出遭遇挫折,成为焦点

avatar
Decrypt
08-09
本文为机器翻译
展示原文

OpenAI备受期待的GPT-5发布——被吹捧为人工智能的划时代飞跃——却遇到了现实的阻碍。

该公司将这个模型宣传为迄今最先进的模型,但早期用户表示推出过程并不顺利。性能缓慢、输出不稳定、功能缺失的报告,加剧了人们对GPT-5和OpenAI是否能兑现承诺的怀疑。

周五,OpenAI首席执行官Sam Altman在X平台上为公司的承诺和错误道歉。

"向所有人推广需要更多时间,"他写道。"这是大规模的重大变革。"

Altman承认了推出过程的艰难,坦言情况比OpenAI预期的更加崎岖。

"我们将继续努力使系统稳定,并持续倾听反馈,"他说。"正如我们之前提到的,我们预计在一次性推出这么多内容时会遇到一些颠簸。但比我们希望的更加颠簸!"

以下是关于GPT-5早期投诉和争议的分析,以及这可能对AI推广的未来意味着什么。

性能问题:不太健谈,更加笨拙

许多免费和Plus层级的用户表示GPT-5感觉更懒惰、更慢、回复更短、更机械。

响应缓慢、回复简短、语气更加机械,使人联想到早期一代的机器人,而非"专家级"AI。有些人甚至认为这是倒退,尤其是与灵活且语境丰富的GPT-4o相比。

Nillion Network的首席技术官John Woods在X平台上写道:"令人难以置信的是,ChatGPT Plus随着GPT-5的发布从必不可少变成了垃圾。"

Hyperbolic Labs的联合创始人兼首席技术官Yuchen Jin称这个模型令人失望——仍然容易产生幻觉,过度使用破折号,并且难以遵循指令。

"我怀念4o、4.5和o3。大型路由器一直让我失望,"他写道。"原来我喜欢长模型列表……请,把我的朋友从葬礼上带出来。"

尽管OpenAI将GPT-5宣传为推理能力的巨大飞跃,但用户表示即使使用重度提示工程也难以达到预期水平。

Raindrop AI的首席技术官Ben Hylak写道:"ChatGPT在GPT-5的路由中存在非常严重的错误。除非你说'再多思考一下',否则几乎每个请求都会被路由到一个非常愚蠢且循环的小型模型。"

一些开发者指出GPT-5在基本编程技能上出现倒退,reportedly在变量作用域和初始化等基本编程概念上犯错——对于一个被宣传为智能代理和自主编码未来的模型来说,这是个令人担忧的信号。

更糟的是,GPT-5引入了像内部齿轮一样运作的"思考模式",但用户无法看到或控制它们。结果就是混乱。有时它是个哲学家,有时却连"蓝莓"中有多少个B都数不清。

推广挫折:我的旧机器人哪去了?

如果你感觉被迫使用GPT-5,你并不孤单。许多用户抱怨旧版模型如GPT-4和4o被突然移除或变得难以访问,使他们被迫使用一个不想要的模型。

这次推广还暴露了不同定价层级之间的巨大差异。免费和Plus用户受到使用限制和阉割版"迷你"版本的限制,而Pro和Team订阅者可以访问完整的GPT-5 Pro。这并非什么新鲜事——但在普遍不满的背景下,显得尤其令人恼火。

即便是Pro用户也报告了高峰期的延迟、宕机和限流,这表明OpenAI可能在处理能力上遇到了困难。

公关失误和伦理红旗

任何高风险的技术发布都有公关失败的风险,而GPT-5正是如此。

OpenAI因使用一些观察者认为具有误导性的性能图表而受到批评。该公司在现场演示中还在一个基本数学例子上犯了错误,这一失误在工程师和投资者中都引起了关注。

伦理担忧继续困扰着这次推广,GPT-5的massive上下文窗口和AI代理能力重新引发了对滥用的担忧,从欺诈和虚假信息到旨在欺骗的合成媒体。算法偏见、隐私侵犯和就业替代等长期存在的问题以更加紧迫的方式重返讨论,加剧了对监管的呼声。

好消息(是的,确实有)

并非一切都是失败的。OpenAI声称GPT-5在几个方面取得了进展:幻觉减少、奉承性更低、在更广泛的主题上推理更加一致。更大的上下文窗口意味着它现在可以在更长的对话中跟踪和整合信息,这对高级用户来说确实很有用。

安全系统也得到了升级,对敏感提示可以提供更细微的响应,尽管有些人仍然觉得GPT-5过于谨慎。

对于使用正确提示并保持耐心的开发者来说,GPT-5可以生成令人印象深刻的代码并处理复杂的推理任务。但对许多人来说,它仍然未达到"改变游戏规则"的宣传。

结论:在严酷世界中的温和发布

GPT-5的首次亮相为AI开发提供了一个警示:技术实力是不够的。期望已经高得惊人,可容忍的错误空间正在缩小。用户想要速度、准确性、个性和控制——并且随时随地都要。

OpenAI现在面临着管理这些期望的双重挑战,同时继续迭代这款尽管存在缺陷,但仍处于AI前沿的产品。该公司的推广策略可能需要像模型本身一样进行微调。

因为如果这就是AI的未来……可能需要一个补丁。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论