중국 인공지능 기업 Z.AI는 수요일 화웨이 프로세서로만 학습된 오픈소스 이미지 생성 모델을 공개했습니다. 이는 주요 AI 모델이 미국산 하드웨어에 의존하지 않고 전체 학습 과정을 완료한 첫 사례입니다.
이번 움직임은 엔비디아의 AI 칩 시장 지배력에 대한 잠재적인 장기적 도전 과제를 부각시키는데, 중국의 주요 AI 기업 중 하나가 미국산 GPU에 의존하지 않고도 대규모 모델을 학습시킬 수 있음을 보여주기 때문이다.
해당 모델은 이미 Hugging Face 에서 다운로드할 수 있으며, 미적 감각과 텍스트 일관성 면에서는 오늘날의 기준으로는 인상적이지는 않지만 괜찮은 결과를 보여줍니다. 또한, 간단한 초기 테스트 결과 공간 인식 능력은 탁월한 것으로 나타났습니다.
베이징에 본사를 둔 이 회사는 지난주 홍콩 기업공개(IPO) 에서 5억 5800만 달러를 조달했으며, 화웨이의 Ascend Atlas 800T A2 서버에서 MindSpore 프레임워크를 사용하여 GLM-Image라는 모델을 학습시켰습니다.
Z.AI는 사우스 차이나 모닝 포스트 에 보낸 성명 에서 "이번 결과가 국내 컴퓨팅 파워의 잠재력을 탐구하는 데 있어 커뮤니티에 귀중한 참고 자료가 되기를 바란다"고 밝혔습니다.
GLM-Image는 총 160억 개의 파라미터를 가진 하이브리드 아키텍처에서 자기회귀 및 확산 기법을 결합합니다. Z.AI의 골렘(GLM)-4 언어 모델을 기반으로 하는 자기회귀 구성 요소는 명령 이해 및 이미지 합성을 처리하고, 확산 디코더는 세부적인 표현을 개선합니다. 이러한 접근 방식은 OpenAI의 최신 이미지 생성 모델인 gpt-image-1.5에서 사용된 기법과 유사하며, gpt-image-1.5는 안정 확산(Stable Diffusion)과 같은 순수 확산 모델에 비해 우수한 텍스트 렌더링 및 프롬프트 준수 성능을 보여주었습니다.
확산 모델은 무작위 시각적 노이즈에서 시작하여 점차 이미지를 다듬어 나가는 방식으로 이미지를 생성하는 반면, 자기회귀 모델은 이전 단계를 기반으로 각 부분을 예측하며 이미지를 단계적으로 구축합니다. 확산 모델은 전반적인 사실감을 표현하는 데 탁월하지만 텍스트나 레이아웃과 같은 세부적인 표현에는 어려움을 겪을 수 있는 반면, 자기회귀 모델은 구조 표현과 지시 사항 준수에 뛰어납니다. 현재 오픈 소스 AI 이미지 생성기에서는 확산 모델이 가장 널리 사용되는 기술입니다.
새로운 하이브리드 시스템은 자기회귀 생성을 사용하여 이미지를 계획하고 확산을 통해 최종 결과를 다듬는 두 가지 접근 방식을 결합합니다.
이번 발표는 미국 정부가 중국 군부와의 연계 의혹으로 2025년 블랙리스트에 올린 Z.AI에 큰 의미를 갖습니다. 당시 블랙리스트 지정으로 인해 Z.AI는 엔비디아의 H100 및 A100 프로세서를 사용할 수 없게 되었습니다. 이번 발표를 통해 Z.AI는 블랙리스트에 오른 기업도 국내 하드웨어를 사용하여 경쟁력 있는 AI 시스템을 개발할 수 있음을 입증했으며, 이는 중국 정부가 오랫동안 보여주고자 했던 성과입니다.
Z.AI의 발표 직후 로이터 통신은 중국 세관 당국이 엔비디아 H200 칩의 수입을 블록 하도록 지시했다고 보도했습니다 . 정부 관계자들은 기술 기업들을 소집해 필요한 경우가 아니면 해당 칩을 구매하지 말라고 경고했습니다. 소식통에 따르면 이러한 지시는 "사실상 당분간 수입 금지"에 해당하는 매우 강력한 조치였습니다.
베이징은 중국 AI 연구소들이 미국산 반도체 없이도 경쟁력 있는 모델을 개발할 수 있다는 신호를 보내는 것으로 보이며, 이는 중국 기업들이 엔비디아 하드웨어를 비축해야 할 필요성을 줄이는 결과를 초래할 수 있다. 베이징이 지난해 8월 이미 수출을 차단했던 H20 칩보다 약 6배 높은 성능을 제공하는 H200은 중국 기업들로부터 개당 2만 7천 달러에 200만 개 이상의 주문을 받았다.
조지타운 대학교 안보 및 신흥 기술 센터의 분석가들은 중국의 반도체 전략이 화웨이 프로세서의 대규모 클러스터를 통해 개별 칩 성능 저하를 보완하는 데 의존한다고 지적했습니다. 이러한 접근 방식은 효과적이지만 더 많은 하드웨어, 더 많은 전력, 그리고 더 많은 엔지니어링 노력을 필요로 합니다.
"이 전략의 핵심 제약 조건 중 하나는 중국이 국내에서 충분한 반도체를 생산하여 기술 격차를 메우고 유지할 수 있는 능력입니다."라고 선임 연구 분석가인 한나 도멘은 11월 CNBC 에 말했습니다.
화웨이 자체 로드맵에 따르면 2026년에 출시될 차세대 칩은 전력 효율 면에서 현재 플래그십 칩보다 오히려 떨어질 것으로 예상됩니다. 하지만 이러한 평가는 중국 연구소들이 알고리즘 효율성을 통해 달성할 수 있는 잠재력을 과소평가하는 것일 수 있습니다. 딥시크(DeepSeek)는 어셈블리 레벨 GPU 최적화를 통해 더 적은 칩으로 경쟁력 있는 모델을 학습시키는 데 성공하며 이를 입증했습니다 .
Z.AI의 GLM-Image는 텍스트 렌더링 및 중국어 문자 생성 분야에서 오픈 소스 모델 중 업계 최고 수준의 벤치마크 점수를 달성했다고 회사 기술 보고서에서 밝혔습니다. 적절한 하드웨어가 없는 사용자는 API를 통해 온라인에서 GLM-Image를 사용해 볼 수 있으며, API 접근 가격은 생성된 이미지당 0.014달러입니다. 또한 Z.AI가 운영하는 무료 Hugging Face Space를 통해서도 사용해 볼 수 있습니다.
Z.AI는 오픈AI와 앤스로픽에 필적하는 대규모 언어 모델 개발 스타트업 그룹인 중국의 'AI 호랑이' 중 최초로 상장했습니다. 중국의 반도체 산업 육성 야망 속에서 딥시크나 알리바바 같은 중국 AI 기업에 대한 투자자들의 열기가 고조되면서 상장 이후 주가는 약 80% 상승했습니다.
한편 화웨이는 올해 어센드 프로세서 생산량을 대폭 늘릴 준비를 하고 있다. 중국 전역의 AI 컨퍼런스에서 화웨이 부스를 더욱 적극적으로 활용하며, 더 이상 캘리포니아 주립대학교 샌타클라라 캠퍼스에 의존하지 않는 국가 AI 인프라의 핵심 주체로 자리매김하려 노력하고 있다.





