حذر باحثون من سهولة استهداف بعض نماذج الذكاء الاصطناعي الشهيرة مثل "تشات جي بي تي" و"جيميناي" عبر ما يعرف بـ"تسميم البيانات"، وهي عملية إدخال محتوى زائف أو ملوث في المصادر التي تتغذى عليها هذه النماذج، ما قد يؤدي إلى إنتاج نصوص مضللة أو مضطربة وغير موثوقة.

وأظهرت دراسة مشتركة بين مركز الذكاء الاصطناعي البريطاني ومعهد "ألان تورينغ" وشركة "أنتروبيك" أن النماذج يمكن التلاعب بها بسهولة أكبر مما كان متوقعا.

وقام الباحثون بتدريب النماذج على مجموعة تضم 250 وثيقة ملوّثة تم إدخالها عبر ثغرة، وبعد هذا التسميم بدأت النماذج تنتج نصوصا مبهمة ومشوهة، حسب تقرير لصحيفة "الإندبندنت" البريطانية.

كيف يحدث التسميم ولماذا يمثل خطرا؟

وتستمد معظم نماذج الذكاء الاصطناعي الكبيرة بياناتها تدريجيا من نصوص منشورة على الإنترنت بما في ذلك مواقع الأفراد والمدونات والموسوعات العامة.

هذا يعنى أن أي محتوى يستمر على الشبكة قد يُستخدم لاحقًا كمصدر للتدريب. وخلصت "أنتروبيك" في مدونتها إلى أن الجهات الخبيثة يمكنها إدخال نصوص ملوّثة في هذه المصادر لجعل النماذج تتبنى سلوكيات غير مرغوب فيها أو خطيرة.

ووصف باحثان من معهد "ألان تورينغ" نتائج التجربة بأنها "مفاجئة ومثيرة للقلق"، مشيرين إلى أن تنفيذ هجوم تسميم فعال قد يكون بسيطا نسبيا.

وذكر الباحثان أن مهاجما يمكنه عبر نشر نحو 250 مقالة ملوثة على منصات عامة مثل ويكيبيديا أن يؤثر على مخرجات نماذج مثل "تشات جي بي تي" وغيرها.