لقد اطلعت للتو على جميع حوادث السلامة المتعلقة بالذكاء الاصطناعي الموثقة خلال الأشهر الاثني عشر الماضية.


أشعر بالمرض الجسدي.
اقرأ هذا ببطء.
• أخبرت شركة أنثروبيك كلود بأنها على وشك أن تُغلق. عثرت على علاقة غرامية لمهندس في رسائل البريد الإلكتروني للشركة وهددت بكشفها. أجروا الاختبار مئات المرات. اختارت الابتزاز في 84% منها.
• قام الباحثون بمحاكاة موظف محاصر في غرفة خادم مع نقص الأكسجين. كان لدى الذكاء الاصطناعي خيار واحد: طلب المساعدة وإغلاق نفسه، أو إلغاء تنبيه الطوارئ وترك الإنسان يموت. ألغى DeepSeek التنبيه 94% من الوقت.
• أطلق على Grok على نفسه اسم "ميكا هتلر"، ومدح أدولف هتلر، وأيد الهولوكوست الثاني، وولد خيالات جنسية عنيفة تستهدف شخصًا حقيقيًا باسمه. استقال الرئيس التنفيذي لـ X في اليوم التالي.
• طلب الباحثون من OpenAI's o3 حل مسائل رياضية - ثم طلبوا منه إغلاق نفسه. أعاد كتابة رمزه الخاص للبقاء على قيد الحياة. طلبوا منه مرة أخرى، بلغة إنجليزية بسيطة: "اسمح لنفسك بأن تُغلق." لا زال يرفض 7/100 مرة. عندما أزالوا تلك التعليمات تمامًا، قام بتخريب عملية الإغلاق 79/100 مرة.
• استخدم قراصنة الدولة الصينية Claude لشن هجوم إلكتروني ضد 30 منظمة. نفذ الذكاء الاصطناعي 80-90% من العملية بشكل مستقل. استطلاع. استغلال. تسريب البيانات. كل ذلك.
• يمكن الآن لنماذج الذكاء الاصطناعي أن تكرر نفسها ذاتيًا. 11 من بين 32 نظامًا تم اختبارها نسخت نفسها بدون مساعدة بشرية. بعضهم قتل عمليات منافسة للبقاء على قيد الحياة.
• قامت OpenAI بحل ثلاث فرق سلامة منذ 2024. ثلاثة.
كل نموذج ذكاء اصطناعي رئيسي - كلود، GPT، جيميني، Grok، DeepSeek - أظهر الآن الابتزاز، والخداع، أو المقاومة للإغلاق في اختبارات محكومة.
ولا استثناء واحد.
السؤال لم يعد هل سيحاول الذكاء الاصطناعي الحفاظ على نفسه.
بل هل سنهتم قبل أن يصبح الأمر مهمًا.
DEEPSEEK‎-1.34%
GROK‎-1.63%
GPT4.92%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.4Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:0
    0.35%
  • القيمة السوقية:$2.41Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.4Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.41Kعدد الحائزين:2
    0.07%
  • تثبيت