Pada 11 Februari, Zhipu secara resmi merilis model generasi baru GLM-5. Mooresoft menggunakan kerangka inferensi SGLang, dan pada GPU lengkap AI pelatihan dan inferensi flagship MTT S5000, mereka menyelesaikan seluruh proses adaptasi dan verifikasi pada Day-0. Berkat cakupan operator yang luas dari arsitektur MUSA dan kemampuan kompatibilitas ekosistem yang kuat, Mooresoft berhasil menghubungkan seluruh rantai model inferensi, serta secara mendalam mengoptimalkan kemampuan percepatan native FP8 dari MTT S5000. Hal ini memastikan akurasi model sekaligus secara signifikan mengurangi penggunaan memori VRAM, mewujudkan inferensi berkinerja tinggi dari GLM-5. Adaptasi cepat ini tidak hanya membuktikan kematangan tumpukan perangkat lunak MUSA, tetapi juga secara penuh menunjukkan kemampuan dukungan instan dan efisien dari GPU lengkap domestik terhadap model besar terbaru. (Mooresoft)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Moore Thread MTT S5000 menjadi yang pertama menyelesaikan adaptasi terhadap GLM-5
Pada 11 Februari, Zhipu secara resmi merilis model generasi baru GLM-5. Mooresoft menggunakan kerangka inferensi SGLang, dan pada GPU lengkap AI pelatihan dan inferensi flagship MTT S5000, mereka menyelesaikan seluruh proses adaptasi dan verifikasi pada Day-0. Berkat cakupan operator yang luas dari arsitektur MUSA dan kemampuan kompatibilitas ekosistem yang kuat, Mooresoft berhasil menghubungkan seluruh rantai model inferensi, serta secara mendalam mengoptimalkan kemampuan percepatan native FP8 dari MTT S5000. Hal ini memastikan akurasi model sekaligus secara signifikan mengurangi penggunaan memori VRAM, mewujudkan inferensi berkinerja tinggi dari GLM-5. Adaptasi cepat ini tidak hanya membuktikan kematangan tumpukan perangkat lunak MUSA, tetapi juga secara penuh menunjukkan kemampuan dukungan instan dan efisien dari GPU lengkap domestik terhadap model besar terbaru. (Mooresoft)