DeepSeek-R1 phát hành tròn 1 năm, tiết lộ mô hình mới 「MODEL1」

BlockBeats tin tức, ngày 21 tháng 1, theo báo cáo của lượng tử vị, nhân dịp kỷ niệm 1 năm ra mắt của DeepSeek-R1, đã tiết lộ về mô hình mới 「MODEL1」. DeepSeek đã cập nhật mã FlashMLA trên GitHub, trong đó có 28 lần đề cập đến MODEL1 trong tổng số 114 tệp, xuất hiện cùng với V32 như các mô hình khác nhau. Được biết V32 là DeepSeek-V3.2, rất có thể MODEL1 là kiến trúc mới. Các khác biệt cụ thể trong mã nằm ở cách bố trí bộ đệm KV, xử lý thưa thớt và giải mã FP8, đồng thời có nhiều điểm khác biệt trong tối ưu hóa bộ nhớ.

Xem bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)