Perusahaan kecerdasan buatan China, Z.AI, pada hari Rabu merilis model generasi gambar sumber terbuka yang dilatih sepenuhnya menggunakan prosesor Huawei, menandai pertama kalinya sebuah model AI besar menyelesaikan seluruh siklus pelatihannya tanpa bergantung pada perangkat keras Amerika.
Langkah ini menyoroti potensi tantangan jangka panjang terhadap dominasi Nvidia dalam chip AI, karena menunjukkan bahwa salah satu perusahaan AI terkemuka China dapat melatih model besar tanpa bergantung pada GPU buatan AS.
Model ini sudah tersedia untuk diunduh di Hugging Face dan menghasilkan hasil yang baik—namun tidak mengesankan menurut standar saat ini—dalam hal estetika dan teks yang koheren, serta menunjukkan kesadaran spasial yang sangat baik berdasarkan pengujian cepat pertama kami.
Gambar yang dihasilkan dengan model baru Z.AI.
Perusahaan yang berbasis di Beijing ini, yang mengumpulkan $558 juta dalam IPO Hong Kong minggu lalu, melatih model yang disebut GLM-Image, menggunakan server Ascend Atlas 800T A2 dari Huawei dengan kerangka kerja MindSpore. “Kami berharap ini dapat memberikan referensi berharga bagi komunitas untuk mengeksplorasi potensi kekuatan komputasi domestik,” kata Z.AI dalam sebuah pernyataan yang dibagikan ke South China Morning Post.
Memperkenalkan GLM-Image: Tonggak baru dalam generasi gambar sumber terbuka.
GLM-Image menggunakan arsitektur hibrida auto-regressive plus difusi, menggabungkan pemahaman semantik global yang kuat dengan detail visual berkualitas tinggi. Ini sebanding dengan model difusi utama dalam kualitas keseluruhan… pic.twitter.com/cjtUYRkge5
— Z.ai (@Zai_org) 14 Januari 2026
GLM-Image menggabungkan teknik autoregressive dan difusi dalam arsitektur hibrida dengan total 16 miliar parameter. Komponen autoregressive, yang berbasis pada model bahasa GLM-4 dari Z.AI, menangani pemahaman instruksi dan komposisi gambar, sementara decoder difusi menyempurnakan detail halus. Pendekatan ini meniru teknik yang digunakan oleh model generasi gambar terbaru OpenAI, gpt-image-1.5, yang menunjukkan rendering teks yang lebih baik dan kepatuhan terhadap prompt dibandingkan model difusi murni seperti Stable Diffusion. Model difusi membuat gambar dengan memulai dari noise visual acak dan secara perlahan menyempurnakannya menjadi gambar, sementara model autoregressive membangun gambar langkah demi langkah, memprediksi setiap bagian berdasarkan apa yang telah ada sebelumnya. Difusi sangat baik dalam realisme keseluruhan tetapi bisa kesulitan dengan detail yang tepat seperti teks atau tata letak, sedangkan model autoregressive unggul dalam struktur dan mengikuti instruksi. Saat ini, difusi adalah teknik utama di antara generator gambar AI sumber terbuka.
Sistem hibrida baru menggabungkan kedua pendekatan, menggunakan generasi autoregressive untuk merencanakan gambar dan difusi untuk menyempurnakan hasil akhir.
Gambar: Z.AI
Rilis ini memiliki bobot penting bagi Z.AI, yang pada tahun 2025 masuk daftar hitam di Washington karena dugaan hubungan dengan militer China. Penetapan ini memutus perusahaan dari prosesor Nvidia H100 dan A100. Sekarang, Z.AI telah membuktikan bahwa perusahaan yang masuk daftar hitam masih bisa menghasilkan sistem AI yang kompetitif menggunakan perangkat keras domestik, sebuah perkembangan yang telah lama diupayakan Beijing untuk ditunjukkan. Tak lama setelah pengumuman Z.AI, Reuters melaporkan bahwa otoritas bea cukai China telah menginstruksikan agen untuk memblokir masuknya chip Nvidia H200 ke negara tersebut. Pejabat pemerintah memanggil perusahaan teknologi ke pertemuan di mana mereka diberitahu untuk tidak membeli chip tersebut kecuali jika benar-benar diperlukan. Kata-kata tersebut, menurut sumber, cukup keras sehingga dianggap sebagai “sebenarnya larangan untuk saat ini.” Beijing tampaknya memberi sinyal bahwa laboratorium AI China dapat membangun model yang mampu tanpa silikon Amerika, mengurangi urgensi bagi perusahaan China untuk menimbun perangkat keras Nvidia. H200, yang memberikan performa sekitar enam kali lipat dari chip H20 yang sudah diblokir Beijing bulan Agustus lalu, telah menghasilkan pesanan dari perusahaan China lebih dari dua juta unit seharga $27.000 per unit. Analis dari Pusat Keamanan dan Teknologi Muncul Georgetown mencatat bahwa strategi chip China bergantung pada mengompensasi performa per-chip yang lebih rendah dengan klaster besar prosesor Huawei. Pendekatan ini berhasil, tetapi membutuhkan lebih banyak perangkat keras, daya, dan upaya rekayasa. “Salah satu kendala utama dalam strategi ini adalah kapasitas China untuk memproduksi cukup banyak chip secara domestik untuk menutup dan mengikuti kesenjangan dalam kemampuan,” kata analis senior Hanna Dohmen kepada CNBC pada bulan November. Menurut peta jalan Huawei sendiri, chip generasi berikutnya pada tahun 2026 sebenarnya akan lebih buruk daripada flagship saat ini dalam hal kekuatan mentah. Tetapi penilaian semacam itu mungkin meremehkan apa yang dapat dicapai laboratorium China melalui efisiensi algoritmik, seperti yang ditunjukkan DeepSeek dengan melatih model kompetitif dengan lebih sedikit chip melalui optimisasi GPU tingkat rakitan.
Sumber: Council on Foreign Relations
GLM-Image dari Z.AI mencapai skor benchmark terdepan industri di antara model sumber terbuka untuk rendering teks dan generasi karakter Cina, menurut laporan teknis perusahaan. Mereka yang tidak memiliki perangkat keras yang tepat juga dapat mencobanya secara online dengan akses API seharga $0.014 per gambar yang dihasilkan, atau melalui Hugging Face Space gratis yang dikelola oleh Z.AI. Z.AI menjadi yang pertama dari “Harimau AI” China, sekelompok startup yang membangun model bahasa besar untuk menyaingi OpenAI dan Anthropic, yang go public. Sahamnya telah naik sekitar 80% sejak pencatatan, mengikuti antusiasme investor terhadap perusahaan AI China seperti DeepSeek atau Alibaba di tengah ambisi chip domestik China. Sementara itu, Huawei bersiap untuk meningkatkan secara tajam produksi prosesor Ascend tahun ini. Kehadiran perusahaan di pameran AI di seluruh China menjadi semakin menonjol saat mereka berusaha memposisikan diri sebagai tulang punggung infrastruktur AI nasional yang tidak lagi bergantung pada Santa Clara.