Em 11 de fevereiro, a Zhipu lançou oficialmente a nova geração de grandes modelos GLM-5. A Mooresoft, com base na estrutura de inferência SGLang, realizou a adaptação e validação de todo o processo no GPU multifuncional de treinamento e inferência AI de nível flagship MTT S5000, no Day-0. Com uma ampla cobertura de operadores graças à arquitetura MUSA e uma forte compatibilidade ecológica, a Mooresoft conseguiu conectar toda a cadeia de inferência do modelo e liberar profundamente a capacidade de aceleração nativa FP8 do MTT S5000, garantindo a precisão do modelo enquanto reduz significativamente o uso de memória de vídeo, alcançando uma inferência de alto desempenho do GLM-5. Esta rápida adaptação não só comprova a maturidade da pilha de software MUSA, mas também demonstra plenamente a capacidade de suporte instantâneo e eficiente de modelos de grande porte pelo GPU nacional multifuncional mais recente. (Mooresoft)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
A Mooresoft MTT S5000 foi a primeira a completar a adaptação ao GLM-5
Em 11 de fevereiro, a Zhipu lançou oficialmente a nova geração de grandes modelos GLM-5. A Mooresoft, com base na estrutura de inferência SGLang, realizou a adaptação e validação de todo o processo no GPU multifuncional de treinamento e inferência AI de nível flagship MTT S5000, no Day-0. Com uma ampla cobertura de operadores graças à arquitetura MUSA e uma forte compatibilidade ecológica, a Mooresoft conseguiu conectar toda a cadeia de inferência do modelo e liberar profundamente a capacidade de aceleração nativa FP8 do MTT S5000, garantindo a precisão do modelo enquanto reduz significativamente o uso de memória de vídeo, alcançando uma inferência de alto desempenho do GLM-5. Esta rápida adaptação não só comprova a maturidade da pilha de software MUSA, mas também demonstra plenamente a capacidade de suporte instantâneo e eficiente de modelos de grande porte pelo GPU nacional multifuncional mais recente. (Mooresoft)