科学文献に AI 生成の偽引用が溢れ、科学者らが警告
生成AIを研究執筆に利用する研究者が増える中、論文に存在しない引用「ハルシネーション」が急増しており、科学界の信頼性が揺らぐ事態が報告されています。arXivなどの主要科学リポジトリに投稿された2025年分の論文を分析した新しい研究により、4 つのプラットフォームに約14万6,900件の架空の引用が含まれていることが明らかになりました。これは2025年単年の数字であり、AIの活用が本格化した2024年半ば以降にその出現率が急激に上昇しました。 調査チームは250万件の論文から抽出した1億1,100万件の参考文献を精査しましたが、95%以上は実在を確認できました。しかし、残りの未対応文献について、タイプミスの訂正やGoogle Scholarでの検索を行い、それでも見つからなかった文献がAIによる捏造であると判定されました。AIモデルは事実ではなく単語の確率に基づいて文章を生成するため、一見もっともらしいが実際には存在しない論文や研究者名を出力してしまう傾向があります。 この問題は特定の悪意ある研究者に限られたものではなく、多くの論文に少量ずつ紛れ込んでいたことで、より広範な問題であることが示唆されました。特に初期の研究者や小規模な研究チームほど、これらの偽の引用を含める割合が高く、AI導入後に生産性が約3倍に増加したケースも観察されています。また、架空の引用は特定の著名な男性研究者に不当に権威が集中する結果を招き、学術界の格差を拡大させる可能性も指摘されています。 現在の科学出版システムにおける防衛策には課題があります。arXiv のモデレーションなどは一部の問題を検出できるものの、存在しない引用の約79%は審査を潜り抜けて公開されてしまっています。同行査読や編集者のチェックでもこれらのエラーを完全に捕捉するのは現実的に困難な状況です。科学は既存の知見の上に成り立っているため、基盤となる参考文献が捏造されていれば、その後の研究も誤った方向に進むリスクがあります。専門家たちは、このまま放置すれば科学の発見から政策決定、さらには一般大衆の理解に至るまで、誤った知識が拡散する恐れがあると警告しています。早急な対策と、AI生成コンテンツへの厳格な検証プロセスの確立が急務となっています。
