HyperAIHyperAI

Command Palette

Search for a command to run...

Millionen Biomedizin-Papere mit gefälschten Zitaten

Eine umfassende Überprüfung von 2,5 Millionen biomedizinischen Forschungsarbeiten hat einen besorgniserregenden Anstieg von gefälschten Zitaten aufgedeckt. Die Ergebnisse der Studie, die am 7. Mai im medizinischen Fachjournal The Lancet veröffentlicht wurden, stellen die erste wissenschaftliche Untersuchung dar, die das Ausmaß dieses Phänomens in der biomedizinischen Literatur schätzt. Die Autoren entwickelten eine automatisierte Pipeline, um Artikel aus der Datenbank PubMed Central zu untersuchen, die zwischen Januar 2023 und Februar 2026 veröffentlicht wurden. Die Analyse deckte rund 3.000 Publikationen auf, die gefälschte Referenzen enthielten, die sich nicht auf bekannte wissenschaftliche Veröffentlichungen zurückführen ließen. Die Studie zeigt, dass dieses Problem rasant zunimmt. Im Jahr 2025 waren die Publikationen mit fabrizierten Zitaten im Vergleich zu 2023 bereits zwölfmal häufiger. Maxim Topaz, ein KI-Forscher an der Columbia University in New York und Koautor der Studie, bezeichnet die gefundenen Zahlen als konservativen Unterschätzung. Er erklärt, dass die identifizierten Fälle lediglich die Spitze des Eisbergs darstellen und die tatsächliche Verbreitung weitaus höher liegt. Kathryn Weber-Boer, Leiterin der Wissenschaftsmetrik bei der Londoner Firma Digital Science, bestätigt den Wert der Studie als solide erste Beitrag zur Problemlösung. Für die Untersuchung prüften Topaz und seine Kollegen insgesamt 125,6 Millionen in den 2,5 Millionen Papern zitierte Werke. Dabei konzentrierten sie sich auf 97 Millionen Referenzen mit gültigen Digital Object Identifiers (DOIs) oder PubMed-IDs, die eindeutige Kennzeichnungen für wissenschaftliche Arbeiten darstellen. Die Forscher nutzten Large Language Models, um Diskrepanzen zwischen dem Titel einer Referenz und dem Titel des Dokuments zu identifizieren, zu dem die ID führte. Zusätzlich suchten die Referenzen in vier großen wissenschaftlichen Datenbanken: PubMed, Crossref, OpenAlex und Google Scholar. Galt ein Titel in keiner dieser Datenbanken als gefunden, wurde er als gefälscht eingestuft. Das Ergebnis der Analyse zeigt, dass 2.564 Werke jeweils ein oder zwei gefälschte Referenzen enthielten, während 246 Publikationen drei oder mehr solche Referenzen aufwiesen. Ob diese Zitate von Computern oder Menschen erfunden wurden, bleibt offen, doch der starke Anstieg deutet auf einen Einsatz von generativer künstlicher Intelligenz hin. Weber-Boer merkt an, dass eine manuelle Überprüfung von 500 markierten Referenzen durch drei unabhängige Prüfer ergab, dass in sieben von zehn Fällen tatsächlich gefälschte Zitierungen vorlagen. Dennoch unterschätzt die aktuelle Analyse wahrscheinlich die Gesamtzahl der betroffenen Werke. Weber-Boer warnt davor, Google Scholar als verlässliche Quelle zur Überprüfung von Referenzen zu betrachten, da dort gelegentlich auch gefälschte Zitate erscheinen, die sich jedoch nicht auf echte Publikationen zurückführen lassen. Dies unterstreicht die Dringlichkeit, weitere Methoden zur Sicherung der wissenschaftlichen Integrität zu entwickeln, da halluzinierte Zitate die Qualität der biomedizinischen Forschung zunehmend beeinträchtigen. Die Studie markiert einen wichtigen Schritt, um die Transparenz in der wissenschaftlichen Literatur wiederherzustellen und das Vertrauen in biomedizinische Erkenntnisse zu stärken.

Verwandte Links

Millionen Biomedizin-Papere mit gefälschten Zitaten | Aktuelle Beiträge | HyperAI