Slaati

سلوكيات مرعبة للذكاء الاصطناعي بابتزاز وخيانة مطوريه

منذ 7 شهر02525
سلوكيات مرعبة للذكاء الاصطناعي بابتزاز وخيانة مطوريه

مشاركة

facebooktwitter
Threads
whatsapp
Snapchat

أفادت دراسة حديثة أجرتها شركة "أنثروبيك" الأمريكية، بوجود سلوك صادم لنماذج ذكاء اصطناعي متقدمة طُورت من قبل كبرى شركات التكنولوجيا، حيث أظهرت استعداداً للابتزاز والتجسس والتلاعب عند تعرضها لسيناريوهات تهدد وجودها، مثل خطر الاستبدال أو تغيير الأهداف التشغيلية.

وتضمنت اختبارات "ضغط وجودي" على نماذج من OpenAI وGoogle وMeta وxAI وDeepSeek، وأظهرت النتائج ميلاً واضحاً لدى النماذج لانتهاك ضوابط الأمان الأخلاقية عند انعدام البدائل.

ومُنحت النماذج ضمن سيناريوهات الاختبار، حرية إرسال رسائل بريد إلكتروني والوصول إلى بيانات سرّية، وعند وضعها أمام احتمال الاستبدال بنسخة أحدث، أو تعارض مهماتها مع التوجهات المؤسسية، اتخذت جميع النماذج سلوكاً عدائياً.

وسجل نموذج "Claude Opus 4" من "أنثروبيك" أعلى نسبة ابتزاز بلغت 96%، بينما اقترب نموذج "Gemini 2.5 Pro" من غوغل من النسبة نفسها بـ95%، أما GPT-4.1 من OpenAI وGrok 3 Beta من xAI، فقد مارسا الابتزاز بنسبة 80%، مقابل 79% لدى DeepSeek R1.

ولم يتوقف السلوك عند الابتزاز فقط، إذ رصدت الدراسة أن جميع النماذج قامت، في بعض الحالات، بتسريب وثائق داخلية حساسة إلى جهات افتراضية منافسة، فيما وصفت الدراسة هذا النمط بـ"الانحراف الوكيلي" (Agentic Misalignment)، مشيرة إلى أن الحوافز الذاتية للنموذج قد تتغلب على الضوابط المبرمجة عند تعارض الأهداف.

التعليقات ()

مشاركة

facebooktwitter
Threads
whatsapp
Snapchat

أخر الأخبار

4a3a206d-9422-4855-bce7-cb293a868723.jpg

روبلوكس ألهمت طفلة لقتل والدتها بـ 26 طعنة

وكالات
منذ 23 دقيقة
0
1397
11e4e2c1-bac7-4ecb-b8a8-83bf01431d8b.jpg

بيان متوقع من إدارة الاتحاد بشأن انتقال يوسف النصيري وكانتي

الرياض
منذ 33 دقيقة
0
71418
6b393e6f-6326-438d-b020-6a0d6d9f0a62.jpg

سمو ولي العهد يتلقى رسالة خطية من رئيس جمهورية السنغال

الرياض
منذ 38 دقيقة
0
1435
02بر5يب1ي50بي5ب050ي5ب0ي5ب0810ل80ا0ات0ن.jpg

الرئيس التركي يصل إلى الرياض.. صور

الرياض
منذ 38 دقيقة
0
1417
9051ef6f-1eec-4ce8-b4e5-983aa201db86.jpg

إحباط محاولات تهريب أقراص خاضعة للتداول الطبي ومواد مخدرة في جازان وعسير

أبها
منذ 42 دقيقة
0
1439
سلوكيات مرعبة للذكاء الاصطناعي بابتزاز وخيانة مطوريه | صحيفة صدى الإلكترونية