人工智能的废料正在流入人们在线发布内容的每个主要平台——Medium 也不例外。
这家已有 12 年历史的出版平台多年来经历了令人眼花缭乱的转型。它终于迎来了财务复苏,今年夏天首次实现月度盈利。Medium 首席执行官托尼·斯塔布尔拜因 (Tony Stubblebine) 和公司其他高管将该平台描述为“人类写作的家园”。但有证据表明,机器人博主也越来越多地涌向该平台。
今年早些时候,《连线》杂志要求人工智能检测初创公司 Pangram Labs 对 Medium 进行分析。该公司在六周内对 274,466 条近期帖子进行了抽样,估计其中超过 47% 的帖子可能是人工智能生成的。“这比我在互联网上看到的其他帖子高出几个数量级,”Pangram 首席执行官 Max Spero 表示。(该公司今年夏天对全球新闻网站的一天分析发现,其中 7% 的帖子可能是人工智能生成的。)
Medium 上的内容往往平庸,尤其是与充斥 Facebook 的达达主义废话相比。人们更APT看到空洞的加密货币快讯,而不是虾耶稣。最有可能由人工智能生成的标签包括“NFT”——在过去几个月中,Pangram 发现 5,712 篇带有这个短语的文章中,有 4,492 篇(约 78%)被归类为可能是人工智能生成的——以及“web3”、“以太坊”、“人工智能”,以及不知为何的“宠物”。
《连线》杂志邀请了第二家人工智能检测初创公司 Originality AI 进行自己的分析。该公司分析了 2018 年 Medium 上的帖子样本,并将其与今年的样本进行了比较。2018 年,估计有 3.4% 的帖子可能是人工智能生成的。首席执行官 Jon Gillham 表示,这一比例与公司的误报率相对应,因为当时人工智能工具尚未得到广泛使用。对于 2024 年,该公司对今年发表的 473 篇文章进行了抽样,怀疑其中有超过 40% 的帖子可能是人工智能生成的。由于彼此不了解对方的分析结果,Originality 和 Pangram 都对人工智能内容的范围得出了类似的结论。
当《连线》杂志就本文联系 Stubblebine 并告知他 AI 检测分析的结果时,Stubblebine 否认了 Medium 存在 AI 问题的说法。“我不相信这些结果的重要性,也不相信这些公司发现了什么,”他说。
Stubblebine 并不否认 Medium 上 AI 生成文章的数量大幅增加。“我们认为,发布到 Medium 上的 AI 生成内容可能比今年年初增加了 10 倍,”他说。他还对平台上出现的 AI 垃圾采取了普遍的对抗态度:“我们强烈反对 AI 内容。”但他反对使用 AI 检测器来评估问题的范围,部分原因是他声称它们无法区分完全由 AI 生成的帖子和较少使用 AI 的帖子。(“这并不准确,”Spero 说;他声称 Pangram 确实可以区分根据提示生成的 ChatGPT 帖子和基于 AI 大纲但以人类写作充实的帖子。)
据 Stubblebine 称,Medium 测试了几种人工智能检测器,并认为它们并不有效。(Stubblebine 还指责 Pangram Labs 试图“通过媒体”敲诈他,因为 Pangram 的首席执行官 Spero 发送了一封电子邮件,详细说明了《连线》要求的分析结果,然后向 Medium 提供服务。“我只是觉得我们可以帮助他们,”Spero 说。)
人工智能检测工具确实存在缺陷。它们的工作原理是分析文本并做出预测,可能会产生假阳性和假阴性。有必要谨慎使用它们来判断个别文章和艺术作品,尤其是在有新一波工具可以欺骗它们的情况下。尽管如此,它们仍然可以作为衡量某些平台和网站上人工智能生成内容数量变化的晴雨表,并且可以帮助研究人员、记者和公众发现模式。
“由于人工智能检测器虽然准确但并不完美,因此无法确定任何单一内容是否由人工智能生成,”吉勒姆说。“不过,他们非常善于发现人工智能写作正在接管 Medium 等平台的趋势。”
其他人也注意到了这一趋势。“在我定期扫描新的人工智能生成的新闻网站时,我每周都会在 Medium 上看到人工智能生成的内容,”在线虚假信息追踪公司NewsGuard 的编辑 McKenzie Sadeghi 说。“我发现其中大部分内容通常与加密、营销、搜索引擎优化有关。”
Stubblebine 坚称这些数字并不能准确反映 Medium 读者的体验。“这无所谓,”他说。“访问 Medium 发布内容的原始信息流并不代表被推荐和查看的内容的实际活动。这些主题的原始信息流中绝大多数可检测到的人工智能生成的故事的浏览量为零。零浏览量是我们的目标,我们已经有一个可以实现 [这一目标] 的系统。”他认为,Medium 结合了通用垃圾邮件过滤系统和人工审核,有效地遏制了人工智能的泛滥。
许多似乎发布大量人工智能生成内容的账户确实似乎只有很少或根本没有读者。例如,一个被 Pangram Labs 标记为可能由人工智能生成的有关加密货币的帖子的账户在一天内发布了六次帖子,但没有任何帖子的互动,这表明影响微不足道。其他被标记的帖子似乎最近被撤下;虽然有些帖子可能是自愿删除的,但其他帖子可能是在发布几天或几周后被 Medium 删除的。根据 Stubblebine 的说法,有时,如果 Medium 发现试图欺骗系统的“垃圾邮件团伙”,它会故意推迟删除垃圾邮件。
不过,零阅读量并非全都是如此。《连线》杂志发现,其他被标记为可能是人工智能生成的文章(由 Pangram、Originality 和人工智能检测公司 Reality Defender 撰写)都有数百个“点赞”,这与其他平台上的“赞”类似,这表明阅读量至少远高于零。
Stubblebine 认为,Medium 质量控制方法的基石是人。“Medium 现在基本上是靠人工策划的,”他说。他提到 Medium 的出版物有 9000 名编辑,此外还有额外的人工评估,以便“提升”或更广泛传播的故事。“如果你很吹毛求疵的话,我认为你可以说我们正在过滤掉人工智能——但除此之外还有一个目标,那就是,我们只是想过滤掉那些不太好的东西。”
Medium 今年已采取措施遏制机器人博主的存在, 并更新了其 AI 政策。其立场与 LinkedIn 和 Facebook 等明确鼓励人们使用 AI 的其他平台形成了鲜明对比。相反,Medium 不再允许 AI 作品在其“合作伙伴”计划中进入付费墙,也不允许其“Boost”计划获得更广泛的人工策划分发,也不允许推广联盟链接。公开的 AI 作品可以获得普遍分发,但未公开的 AI 作品只能获得“网络”分发,这意味着它只会出现在关注作者的人的推送中。Medium 将 AI 生成的作品定义为“大部分内容由 AI 写作程序创作,几乎没有或根本没有编辑、改进、事实核查或更改的作品”。Medium 没有针对这些新规则的任何 AI 专用执行工具。Stubblebine 说:“我们发现,我们现有的策展系统有一个副作用,就是会过滤掉 AI 生成的作品,因为 AI 生成的作品也是糟糕的作品。”
一些 Medium 作家和编辑确实对该平台对人工智能的态度表示赞赏。Medium 最大的流行文化出版物 Fanfare 的创始人埃里克·皮尔斯 (Eric Pierce) 表示,他不必拒绝许多人工智能生成的投稿,他相信 Medium 的 boost 计划的人类策展人有助于突出该平台上最好的人类写作。“我想不起过去几个月我在 Medium 上读到的任何一篇文章,哪怕是暗示是人工智能创作的,”他说。“在互联网拼命想要自生自灭的背景下,Medium 越来越像一个理智的堡垒。”
然而,其他作家和编辑认为,他们目前仍然看到该平台上有大量人工智能生成的文章。内容营销作家马库斯·穆西克(Marcus Musick)是多家出版物的编辑,他写了一篇文章,哀叹他怀疑是人工智能生成的文章如何在网上疯传。(Reality Defender 对这篇文章进行了分析,估计它有 99% 的可能性是“操纵的”。)这篇文章似乎被广泛阅读,获得了超过 13,500 次“点赞”。
除了作为一名读者发现可能的人工智能内容外,Musick 还认为,作为一名编辑,他经常遇到这种问题。他说,他每月会拒绝大约 80%的潜在投稿人,因为他怀疑他们使用了人工智能。他不使用人工智能检测器,因为他认为这种检测器“毫无用处”,而是依靠自己的判断。
虽然 Medium 上可能由 AI 生成的内容数量惊人,但该平台面临的审核挑战(如何展示好的作品并防止垃圾内容)一直困扰着整个网络。AI 的热潮只是加剧了这个问题。例如,虽然点击农场长期以来一直是一个问题,但 AI 为痴迷于 SEO 的企业家提供了一种快速复活僵尸媒体的方法,即通过向其填充AI 垃圾内容。YouTube 上有一整群忙碌的文化企业家创建快速致富教程,鼓励其他人在 Facebook、亚马逊 Kindle 和 Medium 等平台上创建 AI 垃圾内容。(示例标题:“一键 AI SEO Medium 帝国🤯。”)
“Medium 现在与整个互联网处于同样的境地。因为人工智能内容生成速度非常快,所以无处不在,”抄袭顾问乔纳森·贝利 (Jonathan Bailey) 表示。“垃圾邮件过滤器、人工审核员等——这些可能是他们拥有的最好的工具。”
Stubblebine 的观点是,一个平台是否包含大量垃圾内容并不重要,只要它能够成功扩大优秀写作并限制垃圾内容的传播范围即可。这种观点可能比任何试图完全消除人工智能垃圾内容的尝试都更为务实。他的审核策略很可能是最明智的方法。
这也预示着“ 互联网死亡理论”将在未来成为现实。该理论曾是极端网络阴谋论者的领地,认为互联网的绝大部分都缺乏真人和人类创作的帖子,取而代之的是人工智能生成的垃圾和机器人。随着生成人工智能工具变得越来越普遍,放弃试图清除机器人的平台将催生出一个网络世界,在这个世界中,人类创作的作品在被人工智能淹没的平台上越来越难找到。






