كشف تدقيق 2.5 مليون ورقة بيomedيكالية عن زيادة الوهمية في الاستشهادات
كشف تدقيق شامل شمل 2.5 مليون ورقة بحثية طبية حيوية عن وجود ما يقرب من 3000 ورقة تحتوي على مراجع وهمية أو مزورة، وهو ما يُعد أول دراسة تقديرية واسعة النطاق لحجم هذه الظاهرة في الأدبيات العلمية. نشرت النتائج في دورية "ذا لانسيت" في 7 مايو، وتشير إلى أن هذه المشكلة تتفاقم بسرعة هائلة في مجال العلوم الطبية الحيوية. طوّر فريق البحث بقيادة ماكسيم توباز، الباحث في الذكاء الاصطناعي بجامعة كولومبيا، نظامًا آليًا لفحص المراجع الواردة في الأوراق المنشورة في قاعدة بيانات "بيوميديسنترال" بين يناير 2023 ومارس 2026. ركّز التحليل على 125.6 مليون مرجع، مع التركيز تحديدًا على 97 مليون مرجع تملك معرفات رقمية سارية (DOIs) أو معرفات خاصة بقاعدة "بيوميديسنترال". استخدم الباحثون نماذج لغوية كبيرة (LLMs) لمقارنة عناوين المراجع في النصوص بالعناوين الفعلية للمصادر التي تشير إليها معرفات هذه المراجع، وتم البحث عن هذه المراجع عبر أربع قواعد بيانات علمية رئيسية: PubMed وCrossref وOpenAlex وGoogle Scholar. اعتُبر أي مرجع لا يظهر عنوانه في أي من هذه القواعد على أنه مزيّف. كشفت النتائج أن عدد الأوراق التي تحتوي على مراجع مختلقة تضاعف 12 ضعفًا في عام 2025 مقارنة بعام 2023، حيث وُجدت 2564 ورقة تحتوي على مرجع واحد أو اثنين مزيفين، و246 ورقة تحتوي على ثلاثة مراجع مزورة أو أكثر. يؤكد الباحثون أن هذه الأرقام تمثل تقديرًا محافظًا للحقيقة، حيث يوضح توباز أنهم لمسوا فقط قمة الجبل الجليدي، وأن العدد الفعلي قد يكون أعلى بكثير. يرى خبراء مستقلون مثل كاثريين ويبير-بور من شركة "دجيتال ساينس" أن هذه الدراسة تمثل إسهامًا أوليًا وقويًا لفهم المشكلة، لكنها قد لا تزال غير كاملة. على سبيل المثال، لا يُعد "Google Scholar" مصدرًا موثوقًا تمامًا للتحقق من صحة المراجع، إذ قد تظهر المراجع المزيفة أحيانًا في هذا المحرك دون أن ترتبط بنشرات علمية حقيقية. كما أشارت ويبير-بور إلى أن السؤال عما إذا كانت هذه المراجع قد تم اختراعها بواسطة الإنسان أم بواسطة الآلة لا يزال مفتوحًا، إلا أن النمو المتسارع في هذه الظاهرة يشير بقوة إلى وجود مكون ذكاء اصطناعي مولّد وراءها. وفي فحص يدوي لألف مرجع مرفوعة، أكد ثلاثة مراجعين مستقلين أن المراجع كانت مزيفة في سبعة من بين كل عشر حالات. وتُعد هذه النتائج مؤشّرًا خطيرًا على تلوث الأدبيات العلمية، مما يستدعي تطوير آليات تدقيق أكثر دقة لحماية مصداقية البحث العلمي في المستقبل.
