مؤتمر ذكاء اصطناعي كبير يُفجَّر بتعليقات مراجعة مكتوبة بالكامل بواسطة الذكاء الاصطناعي
أثارت مراجعة أوراق بحثية مقدمة إلى المؤتمر الدولي للتمثيلات التعلمية (ICLR) عام 2026، الذي سيُعقد في ريو دي جانيرو، مخاوف واسعة بين الباحثين بسبب انتشار استخدام الذكاء الاصطناعي في كتابة التقييمات العلمية. كشف تحليل أجرته شركة "بانغرام لابز" المتخصصة في كشف النصوص المولدة بالذكاء الاصطناعي أن حوالي 21% من التقييمات التي تلقاها المشاركون كانت مكتوبة بالكامل بواسطة نماذج لغوية كبيرة (LLMs)، بينما تضمنت أكثر من نصف التقييمات علامات واضحة على استخدام الذكاء الاصطناعي. الحالة اشتعلت بعد أن نشر جراهام نيوبيغ، باحث في جامعة كارنيغي ميلون، شكوى على منصة "إكس" (سابقًا تويتر)، مطالباً بمساعدته في إثبات أن تقييمات مقاله تم إعدادها بواسطة الذكاء الاصطناعي. ورد عليه ماكس سبرو، الرئيس التنفيذي لشركة بانغرام لابز، الذي أجرى تحليلًا شاملاً لجميع الـ19,490 مقالاً و75,800 تقييم مقدمة للمؤتمر. استخدمت الشركة أداة تقييم تنبؤية قادرة على كشف النصوص المولدة بالذكاء الاصطناعي، وحددت 15,899 تقييمًا كليًا مُولَّدًا بالذكاء الاصطناعي. كما أظهر التحليل أن 1% من المقالات (199 مقالاً) كانت مكتوبة بالكامل بواسطة الذكاء الاصطناعي، و9% منها تضمنت أكثر من نصف محتواها مُولَّدًا بالذكاء الاصطناعي، بينما كان 61% من المقالات مكتوبة بشكل رئيسي من قبل البشر. وتم نشر النتائج في مقال مسبق (preprint) مُقدَّم إلى المؤتمر نفسه. الباحثون أبدوا قلقهم من تأثير هذا الوضع على مصداقية العملية العلمية. ديسموند إليوت، عالم حاسوب في جامعة كوبنهاغن، أشار إلى أن تقييمًا واحدًا من بين ثلاثة تقييمات تلقاها كان يحتوي على نتائج عددية خاطئة وعبارات غريبة، ما دفع طالب دكتوراه قاد المشروع للاشتباه بكونه مُولَّدًا بالذكاء الاصطناعي. بعد نشر نتائج بانغرام، تأكدت مخاوفه: التقييم المشبوه كان مُصنَّفًا ككليًا مُولَّدًا بالذكاء الاصطناعي، وصنف المقال على حافة الرفض. ال organizers للمؤتمر أعلنت أنهم سيستخدمون أدوات آلية لفحص الامتثال لسياسات استخدام الذكاء الاصطناعي في المقالات والتقييمات، وهو ما يُعد خطوة غير مسبوقة في تاريخ ICLR. بحثا هاريهران، عالم الحاسوب في جامعة كورنيل ورئيس البرنامج العلمي للمؤتمر، أشار إلى أن هذه الحالة تمثل أول تحدٍّ جماعي من نوعه، وستسهم في تقييم موثوقية النظام. النتائج تُظهر تحوّلًا متسارعًا في ممارسة المراجعة العلمية، مع مخاوف متزايدة من تضليل النتائج، وفقدان التقييمات لجودة التحليل العلمي، وتشويه سمعة المؤتمرات العلمية. وسط هذا التحدي، تبرز الحاجة إلى تطوير معايير واضحة، وآليات رقابة فعّالة، لضمان نزاهة البحث العلمي في عصر الذكاء الاصطناعي.
