中國人工智能公司中愛智周三發佈了一款完全基於華為處理器訓練的開源圖像生成模型,這標誌著首個大型人工智能模型在不依賴美國硬件的情況下完成了完整的訓練週期。
此舉凸顯了英偉達在人工智能芯片領域的主導地位可能面臨的長期挑戰,因為它表明中國頂尖的人工智能公司之一無需依賴美國製造的GPU也能訓練大型模型。
該模型已可在Hugging Face上下載,在美觀性和連貫性方面產生了良好的結果(但以今天的標準來看並不令人印象深刻),並且根據我們的初步快速測試,它表現出了出色的空間感知能力。
這家總部位於北京的公司上週在香港上市,籌集了 5.58 億美元。該公司使用 MindSpore 框架,在華為 Ascend Atlas 800T A2 服務器上訓練了名為 GLM-Image 的模型。
Z.AI 在一份發給《南華早報》的聲明中表示:“我們希望這能為業界探索國內計算能力的潛力提供有價值的參考。”
GLM-Image 採用混合架構,結合了自迴歸和擴散技術,總共擁有 160 億個參數。自迴歸組件基於 Z.AI 的GLM-4 語言模型,負責指令理解和圖像合成,而擴散解碼器則負責精細化圖像細節。這種方法與 OpenAI 最新的圖像生成模型 gpt-image-1.5 的技術類似,後者在文本渲染和響應速度方面均優於純擴散模型(例如 Stable Diffusion)。
擴散模型從隨機視覺噪聲開始,逐步細化成圖像;而自迴歸模型則一步一步地構建圖像,根據前面的部分預測每個部分。擴散模型在整體真實感方面表現出色,但在處理文本或佈局等精細細節方面則略顯不足;而自迴歸模型則擅長結構和指令執行。目前,擴散模型是開源人工智能圖像生成器中最主流的技術。
新型混合系統結合了這兩種方法,利用自迴歸生成來規劃圖像,並利用擴散來優化最終結果。
此次發佈對中信人工智能(Z.AI)意義重大。該公司因涉嫌與中國軍方存在關聯,被美國列入2025年黑名單。這一認定導致該公司無法使用英偉達的H100和A100處理器。如今,中信人工智能證明,被列入黑名單的企業依然能夠利用國產硬件開發出具有競爭力的AI系統,而這正是北京長期以來一直試圖展現的能力。
在Z.AI發佈公告後不久,路透社報道稱,中國海關當局已指示相關人員阻止英偉達H200芯片入境。政府官員召集科技公司開會,告知他們除非必要,否則不要購買這些芯片。據消息人士透露,措辭嚴厲,實際上相當於“暫時禁止”。
北京似乎在暗示,中國人工智能實驗室無需使用美國芯片也能構建強大的模型,這降低了中國企業囤積英偉達硬件的緊迫性。H200的性能大約是去年8月北京方面已封禁的H20芯片的六倍,此前中國企業已訂購超過200萬顆,單價2.7萬美元。
喬治城大學安全與新興技術中心的分析師指出,中國的芯片戰略依賴於通過大量部署華為處理器來彌補單芯片性能的不足。這種方法雖然有效,但需要更多的硬件、更高的功耗和更多的工程投入。
高級研究分析師漢娜·多門 (Hanna Dohmen) 在11 月接受CNBC採訪時表示:“這一戰略的關鍵制約因素之一是中國在國內生產芯片的能力,以彌補和跟上能力差距。”
根據華為自身的路線圖,其2026年推出的下一代芯片在原始性能方面實際上會遜於目前的旗艦產品。但這種評估可能低估了中國實驗室通過算法效率提升所能取得的成就,正如DeepSeek通過封裝級GPU優化,用更少的芯片訓練出極具競爭力的模型所展現的那樣。
根據Z.AI的技術報告,其GLM-Image模型在開源文本渲染和漢字生成模型中取得了業界領先的基準測試成績。沒有相應硬件的用戶也可以在線嘗試,API接口的收費為每張生成的圖像0.014美元,或者通過Z.AI維護的免費Hugging Face Space平臺進行體驗。
Z.AI成為中國“人工智能四小龍”中首家上市的公司。這些“人工智能四小龍”致力於構建大型語言模型,以與OpenAI和Anthropic等公司相媲美。自上市以來,Z.AI的股價已上漲約80%,這得益於投資者對DeepSeek和阿里巴巴等中國人工智能公司的熱情,以及中國國內芯片產業的雄心壯志。
與此同時,華為正準備在今年大幅提高其昇騰處理器的產量。該公司在中國各地人工智能大會上的展位越來越顯眼,其目標是將自身打造成為國家人工智能基礎設施的支柱,從而擺脫對聖克拉拉大學的依賴。






