هل جاء النموذج الجديد من DeepSeek؟

robot
إنشاء الملخص قيد التقدم

DeepSeek يواصل اختبار النسخة الجديدة من النموذج بنظام الرمادي، أو النسخة النهائية الرمادية قبل الكشف الرسمي عن V4.

في 11 فبراير، تلقى بعض المستخدمين عند فتح تطبيق DeepSeek إشعارًا بتحديث الإصدار. بعد تحديث التطبيق (1.7.4)، يمكن للمستخدمين تجربة أحدث نماذج DeepSeek. بعد هذا التحديث، تم توسيع طول سياق النموذج من 128K إلى 1M، أي تقريبًا عشرة أضعاف؛ وتم تحديث قاعدة المعرفة حتى مايو 2025، مع تحسينات جوهرية في العديد من القدرات الأساسية.

اكتشف المختبرون أن DeepSeek في الإجابات يذكر أن النسخة الحالية على الأرجح ليست V4، بل من المحتمل أن تكون الشكل النهائي لتطور سلسلة V3، أو النسخة النهائية الرمادية قبل الكشف الرسمي عن V4.

نشرت Nomura Securities في 10 فبراير تقريرًا يفيد بأن، من المتوقع أن لا يثير نموذج DeepSeek V4 الذي من المقرر إطلاقه في منتصف فبراير 2026، حالة الذعر العالمية من الطلب على الحوسبة للذكاء الاصطناعي التي حدثت عند إصدار V3 العام الماضي. وترى أن، القيمة الأساسية لـ V4 تكمن في دفع تطبيقات الذكاء الاصطناعي نحو السوق من خلال ابتكارات في البنية التحتية الأساسية، وليس في قلب سلسلة القيمة الحالية للذكاء الاصطناعي.

وفقًا للتقييم، النسخة الجديدة أصبحت متوافقة مع قدرات نماذج رئيسية مغلقة المصدر مثل Gemini 3 Pro وK2.5 في معالجة المهام المعقدة. وأشارت Nomura إلى أن V4 من المتوقع أن يدمج تقنيتي mHC وEngram، لتجاوز عنق الزجاجة في شرائح الحوسبة والذاكرة من خلال ابتكارات على مستوى الخوارزميات والهندسة. أظهرت الاختبارات الأولية أن أداء V4 في المهام البرمجية قد تجاوز نماذج Anthropic Claude وOpenAI GPT من نفس الجيل.

الأهمية الرئيسية لهذا الإصدار تكمن في تقليل تكاليف التدريب والاستنتاج بشكل كبير، مما يوفر مسارًا عمليًا لشركات النماذج اللغوية الكبيرة وتطبيقات الذكاء الاصطناعي حول العالم لتخفيف عبء رأس المال.

الابتكار في البنية التحتية لتحسين أداء الأجهزة

أشار تقرير Nomura إلى أن أداء شرائح الحوسبة وقيود ذاكرة HBM، دائمًا ما تشكل قيودًا لا مفر منها لصناعة النماذج الكبيرة المحلية. النسخة القادمة من DeepSeek V4 التي ستدمج تقنيتي mHC (الارتباط الفائق والارتباط الفائق المقيد بالمنحنى) وEngram، هي تحسينات على مستوى النظام من منظور التدريب والاستنتاج لمعالجة هذه النقائص.

mHC:

  • الاسم الكامل هو “الارتباط الفائق المقيد بالمنحنى”. يهدف إلى حل مشكلة عنق الزجاجة في تدفق المعلومات وعدم استقرار التدريب عند عمق طبقات Transformer بشكل كبير.

  • ببساطة، يجعل “الحوار” بين طبقات الشبكة العصبية أكثر غنى ومرونة، مع تطبيق قيود رياضية صارمة لمنع تضخيم أو تلف المعلومات. أظهرت التجارب أن النماذج التي تستخدم mHC تتفوق في مهام الاستنتاج الرياضي وغيرها.

Engram:

  • وحدة “الذاكرة الشرطية”. تصميمها يركز على فصل “الذاكرة” عن “الحساب”.

  • المعرفة الثابتة في النموذج (مثل الكيانات والتعبيرات الثابتة) تُخزن بشكل خاص في جدول ذاكرة متفرقة، يمكن وضعه في DRAM منخفضة التكلفة. عند الحاجة إلى استنتاج، يتم استرجاع المعلومات بسرعة. هذا يحرر الذاكرة عالية التكلفة (HBM) لبطاقات الرسوميات، ليتركز على الحسابات الديناميكية.

تحسن تقنية mHC من استقرار التدريب وكفاءته في التقارب، مما يعوض إلى حد ما الفجوة بين الأجيال في أداء شرائح الحوسبة المحلية من حيث عرض النطاق الترددي والكمية الحسابية؛ بينما يهدف هيكل Engram إلى إعادة بناء آلية إدارة الذاكرة، بحيث تتجاوز قيود سعة الذاكرة وعرض النطاق الترددي في ظل محدودية إمدادات HBM، من خلال استراتيجيات وصول أكثر كفاءة. ترى Nomura أن، هاتين الابتكارتين تشكلان معًا حلاً متوافقًا مع بيئة الأجهزة المحلية، ولهما قيمة واضحة على مستوى التنفيذ.

وأشار التقرير إلى أن، الأثر التجاري المباشر لإصدار V4 هو انخفاض حقيقي في تكاليف التدريب والاستنتاج. سيساعد تحسين التكاليف على تنشيط الطلب على التطبيقات، مما يدفع إلى دورة جديدة من بناء البنية التحتية للذكاء الاصطناعي. وفي هذه العملية، من المتوقع أن تستفيد الشركات الصينية المصنعة للأجهزة الذكية من زيادة الطلب والدفع المسبق للاستثمار.

تحول في هيكل السوق من “سيطرة شركة واحدة” إلى “تعدد المنافسين”

استعرض تقرير Nomura التغيرات في هيكل السوق بعد عام من إصدار DeepSeek-V3/R1. في نهاية 2024، كانت نماذج DeepSeek تشغل أكثر من نصف استخدام رموز النماذج المفتوحة المصدر على OpenRouter.

لكن بحلول النصف الثاني من 2025، ومع انضمام المزيد من اللاعبين، تراجع حصتها السوقية بشكل ملحوظ. انتقل السوق من “سيطرة شركة واحدة” إلى “تعدد المنافسين”. البيئة التنافسية لـ V4 أصبحت أكثر تعقيدًا بكثير مقارنة قبل عام. إن كفاءة إدارة الحوسبة وتحسين الأداء في DeepSeek سرّعا من تطور النماذج اللغوية الكبيرة وتطبيقاتها في الصين، غيرت أيضًا من ملامح المنافسة العالمية، وزادت من اهتمام المجتمع بالموديلات المفتوحة المصدر.

فرص لزيادة قيمة شركات البرمجيات

ترى Nomura أن، مقدمو خدمات السحابة العالمية الكبرى يسعون جاهدين وراء الذكاء الاصطناعي العام، وأن سباق الإنفاق الرأسمالي لا يزال مستمرًا، لذلك من المتوقع أن لا يسبب V4 صدمة مماثلة لتلك التي حدثت العام الماضي في سوق البنية التحتية للذكاء الاصطناعي.

لكن مطوري النماذج الكبيرة وتطبيقاتها حول العالم يتحملون أعباء رأس مال متزايدة. إذا استطاع V4 أن يحافظ على الأداء العالي ويقلل بشكل كبير من تكاليف التدريب والاستنتاج، فسيتمكن هؤلاء من تحويل التكنولوجيا إلى إيرادات بشكل أسرع، وتخفيف الضغوط الربحية.

على جانب التطبيقات، فإن النسخة الأقوى والأكثر كفاءة من V4 ستؤدي إلى ظهور وكلاء ذكاء اصطناعي أكثر قوة. لاحظت التقرير أن تطبيقات مثل “علي توميي تشي وان” يمكنها الآن تنفيذ مهام متعددة بشكل أكثر آلية، وأن الوكلاء الذكاء الاصطناعي يتجهون من كونهم أدوات حوار إلى أن يكونوا مساعدين ذكيين قادرين على التعامل مع مهام معقدة.

هذه الوكلاء القادرون على أداء مهام متعددة يحتاجون إلى تفاعل أكثر تكرارًا مع النماذج الكبيرة الأساسية، مما سيستهلك المزيد من رموز التوكن، وبالتالي يرفع الطلب على الحوسبة. لذا، فإن تحسين أداء النموذج لن يقتل البرمجيات، بل سيخلق قيمة للشركات الرائدة في البرمجيات. تؤكد Nomura على ضرورة التركيز على الشركات التي ستستغل قدرات النماذج الكبيرة الجديدة لبناء تطبيقات أو وكلاء ذكاء اصطناعي أصليين ثوريين. قد يؤدي قفز قدرات النموذج إلى رفع سقف نموها مرة أخرى.

تحذيرات المخاطر وشروط الإعفاء

السوق محفوف بالمخاطر، ويجب الحذر عند الاستثمار. لا تشكل هذه المقالة نصيحة استثمارية شخصية، ولم تأخذ في الاعتبار الأهداف أو الحالة المالية أو الاحتياجات الخاصة للمستخدمين. يجب على المستخدمين تقييم مدى توافق الآراء أو الأفكار أو الاستنتاجات الواردة مع ظروفهم الخاصة. يتحمل المستخدمون مسؤولية استثماراتهم.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.42Kعدد الحائزين:2
    0.14%
  • القيمة السوقية:$2.39Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.36Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.37Kعدد الحائزين:1
    0.00%
  • تثبيت