ArXiv、AI「論文水増し」対策へ:生成モデルの検証を行わなかった投稿者は最大1年間の利用停止も
世界的研究者が広く利用するプレプリントプラットフォームの arXiv は最近、AI 生成論文に対する管理方針をさらに厳格化しました。同プラットフォームは長年、コンピュータサイエンスや数学などの分野における重要な学術論文の流通経路であり、論文アップロード時にはまだピアレビューを経ないものの、その内容はすぐに学術議論や研究動向に影響を与えてきました。 以前より、arXiv は質の低い AI 論文が増加していることへの対策を開始しています。例えば、新規ユーザーが初めて原稿を投稿する際には、ベテラン研究者による推薦保証が必要です。また、Cornell University が 20 年以上にわたりホスティングしてきた後、arXiv は資金調達の強化を図り AI の濫用問題などに対処するため、独立した非営利団体へと移行中です。 最新の規則は、arXiv コンピュータサイエンス部門責任者のトーマス・ディーターリッヒ氏によって発表されました。氏は、「明確な証拠」により著者が大規模モデル(LLM)の出力を検証していなかったことが示された場合、論文全体の信頼性が疑問視されると述べています。このような証拠には「虚偽の文献参照」、残存する直接的な AI プロンプト、または大規模モデルとの対話履歴などが含まれます。 新ルールによると、上記の問題が確認されれば、著者は arXiv での投稿を 1 年間停止されます。その後、追加の論文を再アップロードするには、まず正式なピアレビュー付きジャーナルまたはカンファレンスで採用される必要があります。ただし、これはプラットフォームが大規模モデルの使用を全面的に禁止することを意味しません。arXiv は強調し続けており、研究者は LLM を執筆補助として引き続き利用できる一方で、それらのコンテンツが AI によって生成されたか否かを問わず、論文の内容に対して「完全に責任を負う」必要があると指摘しています。 トーマス・ディーターリッヒ氏がメディアの取材に応じた際、この規定は「違反一回限りで制裁を行うもの」と述べましたが、執行前にモデレーターによるマーキングおよびセクションリーダーの確認が必要であり、著者側にも異議申し立て権があることを付け加えました。 近年、学界では AI ハルシネーション問題に関する懸念が高まり続けています。すでに実施されたピアレビュー調査において、バイオメディカル分野における「虚偽の引用」数が増加しており、大規模モデルがその主要因の一つであると考えられています。
