大多数科技巨头都希望将人工智能卖给大众。但马克·扎克伯格却免费赠送 Meta 认为是世界上最好的人工智能模型之一。
Meta 周一免费发布了大型语言模型Llama的最大、功能最强的版本。Meta 尚未披露开发 Llama 3.1 的成本,但扎克伯格最近告诉投资者,他的公司正在 AI 开发上投入数十亿美元。
通过最新发布的版本,Meta 表明大多数人工智能公司青睐的封闭式方法并不是开发人工智能的唯一途径。但该公司也把自己置于围绕发布不受控制的人工智能所带来的危险的争论中心。Meta 训练 Llama 的方式可以防止模型默认产生有害输出,但可以修改模型以消除此类保护措施。
Meta 表示,Llama 3.1 与OpenAI 、谷歌和Anthropic等公司提供的最佳商业产品一样聪明和实用。在衡量人工智能进展的某些基准测试中,Meta 表示该模型是地球上最聪明的人工智能。
“这非常令人兴奋,”斯坦福大学 (Stanford University) 副教授、研究开源 AI 的Percy Liang表示。Liang 表示,如果开发人员发现新模型与业界领先的模型(包括OpenAI 的 GPT-4o)一样强大,那么许多人可能会转向 Meta 的产品。“看看使用情况如何转变将会很有趣,”他说。
在新机型发布时发布的一封公开信中,Meta 首席执行官扎克伯格将 Llama 与开源Linux操作系统进行了比较。当 Linux 在 20 世纪 90 年代末和 21 世纪初开始流行时,许多大型科技公司都投资于封闭式替代方案,并批评开源软件风险大、不可靠。然而,如今 Linux 已广泛应用于云计算,并成为 Android 移动操作系统的核心。
“我相信人工智能也会以类似的方式发展,”扎克伯格在信中写道。“今天,几家科技公司正在开发领先的封闭模型。但开源正在迅速缩小差距。”
然而,Meta 决定免费提供其 AI 并非毫无私利。之前发布的 Llama帮助该公司在 AI 研究人员、开发人员和初创公司中占据了有影响力的地位。梁还指出,Llama 3.1 并非真正开源,因为 Meta 对其使用施加了限制,例如限制了该模型在商业产品中的使用规模。
新版 Llama 拥有 4050 亿个参数或可调整元素。Meta 已经发布了两个较小的 Llama 3 版本,一个有 700 亿个参数,另一个有 80 亿个参数。Meta 今天还发布了这些模型的升级版,品牌为 Llama 3.1。
Llama 3.1 太大,无法在普通计算机上运行,但 Meta 表示,许多云提供商(包括 Databricks、Groq、AWS 和 Google Cloud)将提供托管选项,以允许开发人员运行该模型的自定义版本。该模型也可以在Meta.ai上访问。
一些开发人员表示,新版 Llama 可能会对 AI 开发产生广泛影响。开源 AI 项目EleutherAI的执行董事Stella Biderman也指出,Llama 3 并非完全开源。但 Biderman 指出,Meta 最新许可证的变更将允许开发人员使用 Llama 3 训练自己的模型,而目前大多数 AI 公司都禁止这样做。Biderman 说:“这真的是一件大事。”
与 OpenAI 和谷歌的最新模型不同,Llama 不是“多模式”的,这意味着它不是为处理图像、音频和视频而设计的。但 Meta 表示,该模型在使用网络浏览器等其他软件方面明显表现更好,许多研究人员和公司认为这可以让人工智能更有用。
在 OpenAI 于 2022 年底发布 ChatGPT 后,一些人工智能专家呼吁暂停人工智能开发,因为他们担心该技术可能被滥用或过于强大而无法控制。此后,生存警报逐渐消退,但许多专家仍然担心不受限制的人工智能模型可能会被黑客滥用或用于加速生物或化学武器的开发。
图灵奖获得者杰弗里·辛顿 (Geoffrey Hinton) 表示:“世界各地的网络犯罪分子都会很高兴”,他在机器学习领域(即深度学习)的开创性工作为大型语言模型奠定了基础。
辛顿于 2013 年加入谷歌,但去年离开公司,公开谈论更先进的人工智能模型可能带来的风险。他说,人工智能与开源软件有着根本的不同,因为模型不能以同样的方式进行审查。“人们会根据自己的目的对模型进行微调,而其中一些目的非常糟糕,”他补充道。
Meta 谨慎发布 Llama 的早期版本,有助于缓解一些担忧。该公司表示,在发布之前,Llama 经过了严格的安全测试,并补充说,几乎没有证据表明其模型使武器开发变得更加容易。Meta 表示,它将发布几款新工具,通过调节输出并阻止突破限制的企图,帮助开发人员确保 Llama 模型的安全。Meta 发言人 Jon Carvill 表示,公司将根据具体情况决定是否发布未来的模型。
计算机科学家、专注于人工智能危险的非营利组织人工智能安全中心主任 Dan Hendrycks 表示,Meta 在发布模型之前通常都进行了很好的测试。他说,新模型可以帮助专家了解未来的风险。“今天发布的 Llama 3 将使大型科技公司以外的研究人员能够开展急需的人工智能安全研究。”

