Moore Thread MTT S5000 đi đầu trong việc hoàn thành thích nghi với GLM-5

robot
Đang tạo bản tóm tắt

Ngày 11 tháng 2, Zhipu chính thức ra mắt mô hình lớn thế hệ mới GLM-5. Một số sử dụng khung suy luận SGLang, dựa trên GPU toàn diện cho huấn luyện và suy luận AI cao cấp MTT S5000 của Moorthrend, đã hoàn thành quá trình thích nghi và xác nhận toàn bộ quy trình vào ngày đầu tiên. Nhờ khả năng bao phủ rộng rãi các phép toán của kiến trúc MUSA và khả năng tương thích hệ sinh thái mạnh mẽ, Moorthrend đã thành công trong việc kết nối toàn bộ chuỗi suy luận mô hình, đồng thời khai thác sâu khả năng tăng tốc gốc FP8 của MTT S5000, giảm đáng kể mức tiêu thụ bộ nhớ GPU trong khi đảm bảo độ chính xác của mô hình, đạt được khả năng suy luận hiệu suất cao của GLM-5. Việc thích nghi nhanh này không chỉ chứng minh độ trưởng thành của phần mềm MUSA mà còn thể hiện khả năng hỗ trợ tức thì và hiệu quả của GPU toàn diện nội địa đối với các mô hình lớn mới nhất. (Moorthrend)

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim