Em 11 de fevereiro, a Zhipu lançou oficialmente a nova geração de grandes modelos GLM-5. A Mooresoft, com base na estrutura de inferência SGLang, realizou a adaptação e validação de todo o processo no GPU multifuncional de treinamento e inferência AI de nível flagship MTT S5000, no Day-0. Com uma ampla cobertura de operadores graças à arquitetura MUSA e uma forte compatibilidade ecológica, a Mooresoft conseguiu conectar toda a cadeia de inferência do modelo e liberar profundamente a capacidade de aceleração nativa FP8 do MTT S5000, garantindo a precisão do modelo enquanto reduz significativamente o uso de memória de vídeo, alcançando uma inferência de alto desempenho do GLM-5. Esta rápida adaptação não só comprova a maturidade da pilha de software MUSA, mas também demonstra plenamente a capacidade de suporte instantâneo e eficiente de modelos de grande porte pelo GPU nacional multifuncional mais recente. (Mooresoft)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
A Mooresoft MTT S5000 foi a primeira a completar a adaptação ao GLM-5
Em 11 de fevereiro, a Zhipu lançou oficialmente a nova geração de grandes modelos GLM-5. A Mooresoft, com base na estrutura de inferência SGLang, realizou a adaptação e validação de todo o processo no GPU multifuncional de treinamento e inferência AI de nível flagship MTT S5000, no Day-0. Com uma ampla cobertura de operadores graças à arquitetura MUSA e uma forte compatibilidade ecológica, a Mooresoft conseguiu conectar toda a cadeia de inferência do modelo e liberar profundamente a capacidade de aceleração nativa FP8 do MTT S5000, garantindo a precisão do modelo enquanto reduz significativamente o uso de memória de vídeo, alcançando uma inferência de alto desempenho do GLM-5. Esta rápida adaptação não só comprova a maturidade da pilha de software MUSA, mas também demonstra plenamente a capacidade de suporte instantâneo e eficiente de modelos de grande porte pelo GPU nacional multifuncional mais recente. (Mooresoft)