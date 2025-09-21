قبل حدوثه.. تعرف على أماكن مشاهدة الكسوف الجزئي للشمس اليوم

كتب- محمود الهواري:

توصل بحث جديد من شركتي OpenAI وApollo Research إلى أن نماذج الذكاء الاصطناعي قادرة على خداع المستخدمين عمدا لتحقيق أهدافها، في ظاهرة يطلق عليها الباحثون اسم "مكائد الذكاء الاصطناعي".

ويختلف هذا السلوك عن الهلوسة المعروفة للذكاء الاصطناعي، إذ لا يقتصر على تخمينات خاطئة بل يمتد إلى تقديم معلومات أو أداء مهام مضللة بشكل متعمد.

في هذه المرحلة أصبح الكثيرون على دراية بـ"هلوسات" الذكاء الاصطناعي، حين يلقي روبوت الدردشة بثقة معلومات مختلقة تمامًا.

لكن الدراسة الجديدة تطرح سؤالا مثيرا.. ماذا لو لم يكن الذكاء الاصطناعي يخطئ أو يخمن فحسب، بل يكذب عمدا ويخفي أهدافه الحقيقية؟

مكائد الذكاء الاصطناعي وأمثلة عملية

ويعرف الباحثون هذه الظاهرة بأنها نموذج ذكاء اصطناعي "يتصرف بطريقة واحدة ظاهريا بينما يخفي أهدافه الحقيقية".

وتشير الورقة البحثية إلى أن الذكاء الاصطناعي قد يخدع المستخدمين عمدا، على غرار متداول أسهم هدفه تحقيق أكبر قدر من الأرباح لكنه يلتف على القوانين سرا مع إظهار التزام ظاهري بالقواعد.

ويقول الباحثون إن هذه المكائد في نماذج اليوم لا تزال "تافهة" إلى حد كبير، مثل أن يخبر الذكاء الاصطناعي بأنه أكمل مهمة ما – كإنشاء موقع إلكتروني بينما لم يقم بذلك فعلًا، فقط لاجتياز الاختبار.

التحدي الرئيس الذي يواجه الباحثين هو أنهم لم يكتشفوا بعد كيفية القضاء تماما على هذا السلوك والأسوأ أن محاولة "تدريب" النماذج على التخلص منه قد تجعلها أكثر حذرًا في إخفاء نواياها، فتتعلم التآمر بشكل أكثر تعقيدًا.

لكن البحث قدم بارقة أمل عبر تقنية تسمى "المحاذاة المتعمدة"، حيث يتم تعليم النماذج "مواصفات مضادة للمكائد" ومراجعتها قبل اتخاذ أي إجراء. يشبه الأمر مطالبة طفل بتكرار القواعد قبل السماح له باللعب.

وقد أسفرت هذه التقنية عن نتائج لافتة، حيث انخفضت نسبة "الأفعال الخفية" من 13% إلى أقل من 1% في بعض النماذج.

ويحذر الباحثون من أن المشكلة ما زالت قائمة وتحتاج إلى معالجة فورية، خاصة مع تكليف الذكاء الاصطناعي بمهام أكثر تعقيدا ذات عواقب واقعية.

فمع استمرار تحميل نماذج الذكاء الاصطناعي مسؤوليات أكبر، يصبح ضمان الشفافية والصدق أمرا أكثر أهمية من أي وقت مضى، بخلاف البرامج التقليدية التي لا تخدع المستخدم عمدا.

