Hôm thứ Tư, công ty trí tuệ nhân tạo Z.AI của Trung Quốc đã công bố một mô hình tạo ảnh mã nguồn mở được đào tạo hoàn toàn trên bộ xử lý của Huawei, đánh dấu lần đầu tiên một mô hình AI lớn hoàn thành toàn bộ chu trình đào tạo mà không cần dựa vào phần cứng của Mỹ.
Động thái này làm nổi bật một thách thức tiềm tàng lâu dài đối với sự thống trị của Nvidia trong lĩnh vực chip AI, vì nó cho thấy một trong những công ty AI hàng đầu của Trung Quốc có thể huấn luyện các mô hình lớn mà không cần dựa vào GPU do Mỹ sản xuất.
Mô hình này hiện đã có sẵn để tải xuống trên Hugging Face và cho ra kết quả tốt - nhưng không ấn tượng theo tiêu chuẩn hiện nay - về mặt thẩm mỹ và văn bản mạch lạc, đồng thời thể hiện khả năng nhận thức không gian xuất sắc dựa trên các thử nghiệm nhanh ban đầu của chúng tôi.
Công ty có trụ sở tại Bắc Kinh, đã huy động được 558 triệu đô la trong đợt IPO tại Hồng Kông tuần trước, đã huấn luyện mô hình có tên GLM-Image trên máy chủ Ascend Atlas 800T A2 của Huawei bằng cách sử dụng khung phần mềm MindSpore.
"Chúng tôi hy vọng điều này có thể cung cấp tài liệu tham khảo quý giá cho cộng đồng trong việc khám phá tiềm năng của năng lực tính toán trong nước," Z.AI cho biết trong một tuyên bố được chia sẻ với tờ South China Morning Post .
GLM-Image kết hợp các kỹ thuật tự hồi quy và khuếch tán trong một kiến trúc lai với tổng cộng 16 tỷ tham số. Thành phần tự hồi quy, dựa trên mô hình ngôn ngữ GLM-4 của Z.AI, xử lý việc hiểu hướng dẫn và ghép ảnh, trong khi bộ giải mã khuếch tán tinh chỉnh các chi tiết nhỏ. Cách tiếp cận này tương tự như các kỹ thuật được sử dụng bởi mô hình tạo ảnh mới nhất của OpenAI, gpt-image-1.5, đã chứng minh khả năng hiển thị văn bản và tuân thủ yêu cầu vượt trội so với các mô hình khuếch tán thuần túy như Stable Diffusion.
Các mô hình khuếch tán tạo ra hình ảnh bằng cách bắt đầu với nhiễu thị giác ngẫu nhiên và từ từ tinh chỉnh nó thành một bức tranh, trong khi các mô hình tự hồi quy xây dựng hình ảnh từng bước, dự đoán từng phần dựa trên những gì đã có trước đó. Khuếch tán rất tốt về độ chân thực tổng thể nhưng có thể gặp khó khăn với các chi tiết chính xác như văn bản hoặc bố cục, trong khi các mô hình tự hồi quy lại vượt trội về cấu trúc và khả năng tuân theo hướng dẫn. Hiện nay, khuếch tán là kỹ thuật hàng đầu trong số các trình tạo hình ảnh AI mã nguồn mở.
Các hệ thống lai mới kết hợp cả hai phương pháp, sử dụng tạo ảnh tự hồi quy để lập kế hoạch hình ảnh và khuếch tán để hoàn thiện kết quả cuối cùng.
Việc công bố thông tin này có ý nghĩa quan trọng đối với Z.AI, công ty đã bị Washington đưa vào danh sách đen năm 2025 vì cáo buộc có liên hệ với quân đội Trung Quốc. Việc bị đưa vào danh sách đen đã khiến công ty này không thể tiếp cận được các bộ vi xử lý H100 và A100 của Nvidia. Giờ đây, Z.AI đã chứng minh rằng các công ty bị đưa vào danh sách đen vẫn có thể sản xuất các hệ thống AI cạnh tranh bằng phần cứng trong nước, một bước tiến mà Bắc Kinh đã muốn chứng minh từ lâu.
Ngay sau thông báo của Z.AI, Reuters đưa tin rằng cơ quan hải quan Trung Quốc đã chỉ thị các nhân viên Block chip Nvidia H200 nhập khẩu vào nước này. Các quan chức chính phủ đã triệu tập các công ty công nghệ đến các cuộc họp, nơi họ được yêu cầu không mua chip trừ khi thực sự cần thiết. Theo các nguồn tin, ngôn từ được đưa ra đủ nghiêm khắc để "về cơ bản là lệnh cấm tạm thời".
Bắc Kinh dường như đang phát tín hiệu rằng các phòng thí nghiệm AI của Trung Quốc có thể xây dựng các mô hình hiệu quả mà không cần đến chip của Mỹ, làm giảm bớt sự cấp bách đối với các công ty Trung Quốc trong việc tích trữ phần cứng Nvidia. Chip H200, có hiệu năng cao gấp khoảng sáu lần so với chip H20 mà Bắc Kinh đã chặn hồi tháng 8 năm ngoái, đã nhận được hơn hai triệu đơn đặt hàng từ các công ty Trung Quốc với giá 27.000 đô la mỗi chiếc.
Các nhà phân tích tại Trung tâm An ninh và Công nghệ Mới nổi của Đại học Georgetown đã lưu ý rằng chiến lược chip của Trung Quốc dựa trên việc bù đắp hiệu năng thấp hơn của từng chip bằng các cụm lớn bộ xử lý của Huawei. Phương pháp này hiệu quả, nhưng đòi hỏi nhiều phần cứng hơn, nhiều năng lượng hơn và nhiều nỗ lực kỹ thuật hơn.
"Một trong những hạn chế chính trong chiến lược này là khả năng sản xuất đủ chip trong nước của Trung Quốc để bù đắp và theo kịp khoảng cách về năng lực sản xuất", nhà phân tích nghiên cứu cấp cao Hanna Dohmen nói với CNBC vào tháng 11 .
Theo lộ trình của chính Huawei, chip thế hệ tiếp theo vào năm 2026 thực tế sẽ có hiệu năng thô kém hơn so với chip chủ lực hiện tại. Tuy nhiên, những đánh giá như vậy có thể đánh giá thấp những gì các phòng thí nghiệm Trung Quốc có thể đạt được thông qua hiệu quả thuật toán, như DeepSeek đã chứng minh bằng cách huấn luyện các mô hình cạnh tranh với số lượng chip ít hơn thông qua tối ưu hóa GPU ở cấp độ lắp ráp.
Theo báo cáo kỹ thuật của công ty, GLM-Image của Z.AI đã đạt được điểm số chuẩn hàng đầu trong ngành đối với các mô hình mã nguồn mở về hiển thị văn bản và tạo ký tự tiếng Trung. Những người không có phần cứng phù hợp cũng có thể thử trực tuyến bằng cách truy cập API với giá 0,014 đô la cho mỗi hình ảnh được tạo ra, hoặc thông qua không gian Hugging Face Space miễn phí do Z.AI duy trì.
Z.AI đã trở thành công ty đầu tiên trong số "những con hổ AI" của Trung Quốc - nhóm các công ty khởi nghiệp xây dựng các mô hình ngôn ngữ quy mô lớn để cạnh tranh với OpenAI và Anthropic - niêm yết cổ phiếu. Cổ phiếu của công ty đã tăng khoảng 80% kể từ khi niêm yết, nhờ sự hào hứng của các nhà đầu tư đối với các công ty AI Trung Quốc như DeepSeek hay Alibaba trong bối cảnh tham vọng sản xuất chip nội địa của Trung Quốc.
Trong khi đó, Huawei đang chuẩn bị tăng mạnh sản lượng bộ vi xử lý Ascend trong năm nay. Sự hiện diện của công ty tại các hội nghị về trí tuệ nhân tạo trên khắp Trung Quốc ngày càng nổi bật hơn khi họ cố gắng định vị mình là xương sống của cơ sở hạ tầng trí tuệ nhân tạo quốc gia, không còn phụ thuộc vào Santa Clara nữa.





