أخبار مهمة تتوالى حول نماذج الذكاء الاصطناعي الكبرى في الصين.
في مساء يوم 11 فبراير، أكد المكتب الرسمي ل智谱 أن النموذج الغامض “Pony Alpha”، الذي تصدر قائمة الشعبية على منصة خدمات النماذج العالمية OpenRouter، هو النموذج الجديد لـ智谱 وهو GLM-5. وقد تم إطلاق النموذج الجديد الآن على منصة chat.z.ai.
في 6 فبراير، أطلقت منصة خدمات النماذج العالمية OpenRouter بشكل سري نموذجًا رمزيًا باسم “Pony Alpha”، وهو نموذج مجهول الهوية، نظرًا لقدراته القوية في التشفير، ونافذة السياق الطويلة جدًا، وتحسينات عميقة في سير عمل الوكيل الذكي، سرعان ما جذب اهتمام مجتمع المطورين، وارتفعت شعبيته بسرعة في المجتمعات الخارجية.
وصف OpenRouter النموذج Pony Alpha بأنه “نموذج أساسي متقدم”، وأظهر أداء قوي في البرمجة، وسير عمل الوكيل الذكي، والاستنتاج، ولعب الأدوار، مع التركيز بشكل خاص على “دقة عالية جدًا في استدعاء الأدوات”. تميزت هذه الخاصية بميزة واضحة في تطبيقات الوكيل الذكي (AI Agent)، حيث يمكن للمطورين استدعاؤه باستخدام أدوات مثل Claude Code، لتنفيذ مشاريع معقدة تمتد لعدة ساعات.
في 8 يناير، تم إدراج شركة智谱 رسميًا في بورصة هونغ كونغ، وخلال يوم الإدراج، أرسل كبير العلماء في الشركة، أستاذ علوم الحاسوب في جامعة Tsinghua، Tang Jie، رسالة داخلية للجميع، أكد فيها أن الجيل الجديد من النماذج الأساسية GLM-5 “سيتم إصداره قريبًا”، وأعلن عن عودة كاملة إلى أبحاث النماذج الأساسية بدءًا من عام 2026، مع إنشاء قسم الابتكار المتقدم X-Lab، الذي يركز على ثلاثة مجالات رئيسية: الهيكل، ونماذج التعلم، والتطور المستمر.
بالإضافة إلى ذلك، قامت شركة DeepSeek أيضًا بتحديث نماذجها. وفقًا للتقارير، قام العديد من المستخدمين بتحديث إصدار DeepSeek على الويب والتطبيق، لدعم طول سياق يصل إلى مليون رمز Token. وكان إصدار العام الماضي، DeepSeekV3.1، قد وسع طول السياق إلى 128 ألف.
حاليًا، هناك عدد قليل من النماذج التي يمكنها دفع السياق إلى مستوى المليون، ومن بينها سلسلة Gemini من Google وClaude Opus 4.6 من شركة Anthropic، التي كانت قد حققت ذلك سابقًا.
تُعرف نماذج سلسلة V من DeepSeek بأنها نماذج أساسية تسعى لتحقيق الأداء الشامل الأقصى. النموذج الأساسي V3، الذي أُطلق في ديسمبر 2024، يُعد علامة فارقة مهمة، حيث أن هيكله الفعال المبني على MoE وضع أساسًا قويًا للأداء الشامل. بعد ذلك، قامت DeepSeek بسرعة بتحديث النموذج، وأطلقت V3.1 التي عززت قدرات الاستنتاج والوكيل الذكي، وفي ديسمبر 2025، أطلقت الإصدار الرسمي الأحدث V3.2. كما أطلقت نسخة خاصة تُركز على حل المشكلات الرياضية والأكاديمية الصعبة، وهي V3.2-Speciale.
ذكرت وسائل الإعلام التقنية، مثل The Information، أن DeepSeek ستطلق خلال منتصف فبراير من العام الحالي، خلال عيد الربيع الصيني، النموذج الرائد الجديد DeepSeek V4، الذي سيكون أكثر قدرة على كتابة الأكواد.
في بداية هذا العام، أصدر فريق DeepSeek ورقتين بحثيتين، كشفتا عن بنية مبتكرة تتضمن: mHC (القيود على التدفق عبر التضاريس) لتحسين تدفق المعلومات في Transformer العميق، مما يجعل تدريب النموذج أكثر استقرارًا وأسهل في التوسع، مع تحسين الأداء دون زيادة عبء الحوسبة؛ و Engram (وحدة الذاكرة الشرطية) التي تفصل بين المعرفة الثابتة والحسابات الديناميكية، وتخزن المعرفة المادية باستخدام DRAM منخفضة التكلفة، مما يحرر HBM المكلف للتركيز على الاستنتاج، ويقلل بشكل كبير من تكلفة الاستنتاج في السياقات الطويلة.
وفي نفس اليوم، وردت أنباء أيضًا عن MiniMax، حيث من المتوقع أن يتم إطلاق نموذج M2.5 رسميًا قريبًا، وقد تم بالفعل اختبار النموذج M2.5 في منتجات MiniMax Agent في الخارج.
(المصدر: صحيفة Daily Economic News)
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
Deepseek، Zhipu، MiniMax يعلنون بشكل جماعي عن إطلاق تحديث جديد
أخبار مهمة تتوالى حول نماذج الذكاء الاصطناعي الكبرى في الصين.
في مساء يوم 11 فبراير، أكد المكتب الرسمي ل智谱 أن النموذج الغامض “Pony Alpha”، الذي تصدر قائمة الشعبية على منصة خدمات النماذج العالمية OpenRouter، هو النموذج الجديد لـ智谱 وهو GLM-5. وقد تم إطلاق النموذج الجديد الآن على منصة chat.z.ai.
في 6 فبراير، أطلقت منصة خدمات النماذج العالمية OpenRouter بشكل سري نموذجًا رمزيًا باسم “Pony Alpha”، وهو نموذج مجهول الهوية، نظرًا لقدراته القوية في التشفير، ونافذة السياق الطويلة جدًا، وتحسينات عميقة في سير عمل الوكيل الذكي، سرعان ما جذب اهتمام مجتمع المطورين، وارتفعت شعبيته بسرعة في المجتمعات الخارجية.
وصف OpenRouter النموذج Pony Alpha بأنه “نموذج أساسي متقدم”، وأظهر أداء قوي في البرمجة، وسير عمل الوكيل الذكي، والاستنتاج، ولعب الأدوار، مع التركيز بشكل خاص على “دقة عالية جدًا في استدعاء الأدوات”. تميزت هذه الخاصية بميزة واضحة في تطبيقات الوكيل الذكي (AI Agent)، حيث يمكن للمطورين استدعاؤه باستخدام أدوات مثل Claude Code، لتنفيذ مشاريع معقدة تمتد لعدة ساعات.
في 8 يناير، تم إدراج شركة智谱 رسميًا في بورصة هونغ كونغ، وخلال يوم الإدراج، أرسل كبير العلماء في الشركة، أستاذ علوم الحاسوب في جامعة Tsinghua، Tang Jie، رسالة داخلية للجميع، أكد فيها أن الجيل الجديد من النماذج الأساسية GLM-5 “سيتم إصداره قريبًا”، وأعلن عن عودة كاملة إلى أبحاث النماذج الأساسية بدءًا من عام 2026، مع إنشاء قسم الابتكار المتقدم X-Lab، الذي يركز على ثلاثة مجالات رئيسية: الهيكل، ونماذج التعلم، والتطور المستمر.
بالإضافة إلى ذلك، قامت شركة DeepSeek أيضًا بتحديث نماذجها. وفقًا للتقارير، قام العديد من المستخدمين بتحديث إصدار DeepSeek على الويب والتطبيق، لدعم طول سياق يصل إلى مليون رمز Token. وكان إصدار العام الماضي، DeepSeekV3.1، قد وسع طول السياق إلى 128 ألف.
حاليًا، هناك عدد قليل من النماذج التي يمكنها دفع السياق إلى مستوى المليون، ومن بينها سلسلة Gemini من Google وClaude Opus 4.6 من شركة Anthropic، التي كانت قد حققت ذلك سابقًا.
تُعرف نماذج سلسلة V من DeepSeek بأنها نماذج أساسية تسعى لتحقيق الأداء الشامل الأقصى. النموذج الأساسي V3، الذي أُطلق في ديسمبر 2024، يُعد علامة فارقة مهمة، حيث أن هيكله الفعال المبني على MoE وضع أساسًا قويًا للأداء الشامل. بعد ذلك، قامت DeepSeek بسرعة بتحديث النموذج، وأطلقت V3.1 التي عززت قدرات الاستنتاج والوكيل الذكي، وفي ديسمبر 2025، أطلقت الإصدار الرسمي الأحدث V3.2. كما أطلقت نسخة خاصة تُركز على حل المشكلات الرياضية والأكاديمية الصعبة، وهي V3.2-Speciale.
ذكرت وسائل الإعلام التقنية، مثل The Information، أن DeepSeek ستطلق خلال منتصف فبراير من العام الحالي، خلال عيد الربيع الصيني، النموذج الرائد الجديد DeepSeek V4، الذي سيكون أكثر قدرة على كتابة الأكواد.
في بداية هذا العام، أصدر فريق DeepSeek ورقتين بحثيتين، كشفتا عن بنية مبتكرة تتضمن: mHC (القيود على التدفق عبر التضاريس) لتحسين تدفق المعلومات في Transformer العميق، مما يجعل تدريب النموذج أكثر استقرارًا وأسهل في التوسع، مع تحسين الأداء دون زيادة عبء الحوسبة؛ و Engram (وحدة الذاكرة الشرطية) التي تفصل بين المعرفة الثابتة والحسابات الديناميكية، وتخزن المعرفة المادية باستخدام DRAM منخفضة التكلفة، مما يحرر HBM المكلف للتركيز على الاستنتاج، ويقلل بشكل كبير من تكلفة الاستنتاج في السياقات الطويلة.
وفي نفس اليوم، وردت أنباء أيضًا عن MiniMax، حيث من المتوقع أن يتم إطلاق نموذج M2.5 رسميًا قريبًا، وقد تم بالفعل اختبار النموذج M2.5 في منتجات MiniMax Agent في الخارج.
(المصدر: صحيفة Daily Economic News)