Meta 已开始训练 Llama 3 的更强大继任者

04-19

本文为机器翻译

展示原文

周四上午，Meta 发布了其最新的人工智能模型 Llama 3，并称其是最强大的开源模型，任何人都可以使用。同一天下午， Meta 首席人工智能科学家 Yann LeCun表示，Llama 的更强大的继任者正在研发中。他表示，这款模型可能会超越世界上最好的封闭式人工智能模型，包括OpenAI 的 GPT-4和谷歌的Gemini 。

Meta 今天发布了两个版本的 Llama 3，一个有 80 亿个参数（这是行业术语，大致表示模型的强大程度），另一个有 700 亿个参数。LeCun 表示，更大的模型正在开发中，最强大的模型有超过 4000 亿个参数，目前正在训练中。

LeCun 在麻省理工学院 (MIT) 举办的以生成式人工智能为主题的会议“想象力在行动” (Imagination in Action)上表示：“虽然微调需要花费大量时间，但未来几个月内，这些模型的大量变体将问世。”目前尚不清楚这个拥有超过 4000 亿个参数的模型何时发布。

Meta 周二推出了一款基于 Llama 3的新助手 Meta AI ，并表示测试表明，这些模型比具有类似参数数量的先前开源模型更好。尽管谷歌和 OpenAI 等大多数最大的人工智能开发商都对其技术保持封闭，但 LeCun 预测开源人工智能模型将发展得更快。他说，从理论上讲，它们将更快地推动人工智能向人类水平的智能迈进。

LeCun 认为，从更广泛的软件行业来看，开源技术最终会胜出。他说，开放方法已成为软件基础设施的主导，因为它可以更快地共享改进，并更全面地审查代码。“当更多人查看代码时，人工智能会更好，”他说。“基础设施需要开源——这样才能进步得更快。”

Meta 的开源 AI 战略加速了当前围绕生成式 AI 的狂热。当该公司于 2023 年 7 月发布其 Llama 2 模型时，它为许多初创公司、研究人员和企业家提供了更强大的 AI 模型，供他们下载进行实验和开发。

OpenAI 的 GPT-4 和 Google 的Gemini只能通过付费 API 获得，不过 Google 在 2 月份推出了一款名为 Gemma 的小型模型供下载。少数其他公司选择加入 Meta 的行列，发布功能强大的开源 AI 模型。就在几周前，初创公司 Databricks 推出的一款新模型是目前最强大的开源版本。如果 Meta 报告的基准测试分数正确的话，Llama 3 似乎更强大。

LeCun 周二还承认，Meta 的策略包括免费提供人工智能模型，而 Meta 为开发这些模型付出了高昂的研究和计算资源成本。Meta 创始人兼首席执行官马克·扎克伯格 (Mark Zuckerberg ) 今年 1 月告诉 CNBC ，Meta 将在 2024 年斥资数十亿美元购买训练机器学习算法所需的 GPU。同月，他宣布Meta 的最终目标——就像 OpenAI 和谷歌宣称的那样——是开发所谓的通用人工智能，即可以做人类智力所能做的任何事情的机器。

扎克伯格今天在 Instagram 上解释说，Meta 将把由 Llama 3 提供支持的全新 Meta AI 助手整合到 Whatsapp、Instagram、Facebook 和 Messenger 等产品中。

Meta 在宣布 Llama 3 的博客文章中表示，它重点关注改进用于开发模型的训练数据。该公司表示，它的数据量是其前身 Llama 2 的七倍。一些人工智能专家指出，Meta 发布的数据显示，创建 Llama 3需要大量能源来为所需的服务器供电。

开源 AI 模型的能力不断增强，这让一些专家担心，它们可能会让网络、化学或生物武器的开发变得更加容易，甚至对人类产生敌意。Meta发布了一些工具，声称可以帮助确保 Llama 不会输出可能有害的言论。

人工智能领域的其他人士表示，Meta 的 Llama 模型不够开放。该公司对这些模型的开源许可对研究人员和开发人员可以构建的内容施加了一些限制。

“很高兴看到越来越多的模型公开发布它们的权重，”非营利实验室艾伦人工智能研究所高级应用研究科学家 Luca Soldaini 在 Llama 3 发布后发表声明称。“但开放社区需要访问人工智能管道的所有其他部分——其数据、训练、日志、代码和评估。这最终将加速我们对这些模型的集体理解。”

参与非营利性开源 AI 项目EleutherAI的 AI 研究员Stella Biderman表示，Meta 的 Llama 2 许可证限制了 AI 研究人员可以用它来进行的实验，并补充说 Llama 3 许可证看起来更加严格。“Meta 发布了权重，但对如何使用它们有严格的限制，”Biderman 说。

该模型许可证的一部分规定，“月活跃用户超过 7 亿”的公司必须向 Meta 申请特殊许可——这一条款显然是为了防止该项目帮助该公司最接近的竞争对手。

即便如此，Llama 3 似乎仍可能引发新一轮人工智能实验。HuggingFace 首席执行官 Clement Delange 表示，开发人员已经创建了 30,000 多个 Llama 2 变体。HuggingFace是一个开放人工智能模型库，其中包括 Llama 3。“我相信我们也会看到大量基于 Llama 3 的新模型，”他说。“Meta 的社区举措非常棒。”