arXiv geht gegen KI-"Papierflut" vor: Wer die Inhalte großer Sprachmodelle nicht überprüft hat, riskiert ein Jahr Sperrung
Als weltweit von Forschern häufig genutzte Preprint-Plattform hat arXiv seine Richtlinien zur Verwaltung KI-generierter Beiträge kürzlich weiter verschärft. Die Plattform ist seit langem ein wichtiger Kanal für die Verbreitung wissenschaftlicher Arbeiten in Bereichen wie Informatik und Mathematik; obwohl eingereichte Manuskripte zum Zeitpunkt des Uploads noch nicht peer-reviewed sind, beeinflussen sie doch rasch akademische Diskussionen und Forschungsrichtungen. Bisher hatte arXiv bereits Maßnahmen ergriffen, um der zunehmenden Zahl qualitativ minderwertiger KI-Publikationen zu begegnen. So müssen beispielsweise neue Nutzer bei ihrer ersten Einreichung eine Empfehlung eines erfahrenen Forschers vorlegen. Zudem befindet sich arXiv nach mehr als zwanzig Jahren Betreuung durch das Cornell College auf dem Weg zu einer eigenständigen gemeinnützigen Organisation, um zusätzliche Mittel für die Bewältigung von Problemen wie Missbrauch durch künstliche Intelligenz zu gewinnen. Die neuesten Regeln wurden vom Leiter der Computer Science-Sektion von arXiv, Thomas Dietterich, bekanntgegeben. Er erklärte, dass die Glaubwürdigkeit eines gesamten Beitrags infrage gestellt werde, wenn „klare Hinweise" darauf deuteten, dass der Autor die Ergebnisse großer Sprachmodelle nicht überprüft habe. Zu solchen Hinweisen zählen unter anderem „fiktive Referenzen", direkt verbliebene KI-Prompts oder Inhalte aus Dialogen mit großen Modellen. Gemäß den neuen Vorschriften werden Autoren, sofern solche Probleme bestätigt werden, für ein Jahr davon ausgeschlossen, weitere Beiträge bei arXiv einzureichen. Anschließend dürfen ihre weiteren Werke erst wieder hochgeladen werden, nachdem sie zuvor in einem formalen Peer-Review-Journal oder einer Konferenz angenommen wurden. Dies bedeutet jedoch kein generelles Verbot der Nutzung großer Modelle auf der Plattform. arXiv betont ausdrücklich, dass Forscher weiterhin große Sprachmodelle (LLMs) zur Unterstützung beim Schreiben verwenden können, wobei sie jedoch – unabhängig davon, ob die Inhalte von KI stammen oder nicht – die volle Verantwortung für den Inhalt ihres Werkes tragen müssen. In einem Interview mit Medien äußerte Thomas Dietterich, es handele sich dabei um eine Regel, die bei einmaligem Fehlverhalten sofortige Sanktionen nach sich ziehe; dennoch seien vor deren Durchsetzung Markierungen durch Moderatoren sowie Bestätigungen durch den jeweiligen Sektionsleiter erforderlich, und den betroffenen Autoren stehe ein Beschwerderecht offen. In jüngster Zeit nimmt die Sorge innerhalb der Wissenschaftsgemeinde über Phänomene wie Halluzinationen durch KI kontinuierlich zu. Bereits veröffentlichte Studien im Rahmen des Peer-Reviews zeigen, dass die Anzahl „fiktiver Zitate" im Bereich Biomedizin zunimmt, wobei große Sprachmodelle als wesentlicher Faktor dafür gelten.
