中国发布首个不使用美国芯片训练的大型人工智能图像生成模型

Decrypt

01-15

本文为机器翻译

展示原文

中国人工智能公司中爱智周三发布了一款完全基于华为处理器训练的开源图像生成模型，这标志着首个大型人工智能模型在不依赖美国硬件的情况下完成了完整的训练周期。

此举凸显了英伟达在人工智能芯片领域的主导地位可能面临的长期挑战，因为它表明中国顶尖的人工智能公司之一无需依赖美国制造的GPU也能训练大型模型。

该模型已可在Hugging Face上下载，在美观性和连贯性方面产生了良好的结果（但以今天的标准来看并不令人印象深刻），并且根据我们的初步快速测试，它表现出了出色的空间感知能力。

这家总部位于北京的公司上周在香港上市，筹集了 5.58 亿美元。该公司使用 MindSpore 框架，在华为 Ascend Atlas 800T A2 服务器上训练了名为 GLM-Image 的模型。

Z.AI 在一份发给《南华早报》的声明中表示：“我们希望这能为业界探索国内计算能力的潜力提供有价值的参考。”

GLM-Image 采用混合架构，结合了自回归和扩散技术，总共拥有 160 亿个参数。自回归组件基于 Z.AI 的GLM-4 语言模型，负责指令理解和图像合成，而扩散解码器则负责精细化图像细节。这种方法与 OpenAI 最新的图像生成模型 gpt-image-1.5 的技术类似，后者在文本渲染和响应速度方面均优于纯扩散模型（例如 Stable Diffusion）。

扩散模型从随机视觉噪声开始，逐步细化成图像；而自回归模型则一步一步地构建图像，根据前面的部分预测每个部分。扩散模型在整体真实感方面表现出色，但在处理文本或布局等精细细节方面则略显不足；而自回归模型则擅长结构和指令执行。目前，扩散模型是开源人工智能图像生成器中最主流的技术。

新型混合系统结合了这两种方法，利用自回归生成来规划图像，并利用扩散来优化最终结果。

此次发布对中信人工智能（Z.AI）意义重大。该公司因涉嫌与中国军方存在关联，被美国列入2025年黑名单。这一认定导致该公司无法使用英伟达的H100和A100处理器。如今，中信人工智能证明，被列入黑名单的企业依然能够利用国产硬件开发出具有竞争力的AI系统，而这正是北京长期以来一直试图展现的能力。

在Z.AI发布公告后不久，路透社报道称，中国海关当局已指示相关人员阻止英伟达H200芯片入境。政府官员召集科技公司开会，告知他们除非必要，否则不要购买这些芯片。据消息人士透露，措辞严厉，实际上相当于“暂时禁止”。

北京似乎在暗示，中国人工智能实验室无需使用美国芯片也能构建强大的模型，这降低了中国企业囤积英伟达硬件的紧迫性。H200的性能大约是去年8月北京方面已封禁的H20芯片的六倍，此前中国企业已订购超过200万颗，单价2.7万美元。

乔治城大学安全与新兴技术中心的分析师指出，中国的芯片战略依赖于通过大量部署华为处理器来弥补单芯片性能的不足。这种方法虽然有效，但需要更多的硬件、更高的功耗和更多的工程投入。

高级研究分析师汉娜·多门 (Hanna Dohmen) 在11 月接受CNBC采访时表示：“这一战略的关键制约因素之一是中国在国内生产芯片的能力，以弥补和跟上能力差距。”

根据华为自身的路线图，其2026年推出的下一代芯片在原始性能方面实际上会逊于目前的旗舰产品。但这种评估可能低估了中国实验室通过算法效率提升所能取得的成就，正如DeepSeek通过封装级GPU优化，用更少的芯片训练出极具竞争力的模型所展现的那样。

根据Z.AI的技术报告，其GLM-Image模型在开源文本渲染和汉字生成模型中取得了业界领先的基准测试成绩。没有相应硬件的用户也可以在线尝试，API接口的收费为每张生成的图像0.014美元，或者通过Z.AI维护的免费Hugging Face Space平台进行体验。

Z.AI成为中国“人工智能四小龙”中首家上市的公司。这些“人工智能四小龙”致力于构建大型语言模型，以与OpenAI和Anthropic等公司相媲美。自上市以来，Z.AI的股价已上涨约80%，这得益于投资者对DeepSeek和阿里巴巴等中国人工智能公司的热情，以及中国国内芯片产业的雄心壮志。

与此同时，华为正准备在今年大幅提高其昇腾处理器的产量。该公司在中国各地人工智能大会上的展位越来越显眼，其目标是将自身打造成为国家人工智能基础设施的支柱，从而摆脱对圣克拉拉大学的依赖。

来源

免责声明：以上内容仅为作者观点，不代表Followin的任何立场，不构成与Followin相关的任何投资建议。

喜欢