HyperAIHyperAI

Command Palette

Search for a command to run...

250 万件の生物医学論文審査、偽引用の急増が判明

250 万編の生物医学論文を対象とした大規模監査により、約 3,000 編に実在しない架空の引用が混入していることが明らかにされました。この結果は5月7日に学術誌『ランセット』に掲載され、同分野における架空引用の規模を初めて推定した画期的な研究です。調査チームはニューヨークのコロンビア大学に所在する人工知能研究者のマキシム・トパズ氏らによって構成され、2023年1月から2026年2月までに PubMed Central に登録された論文から、無作為に抽出された 250 万編を自動パイプラインでスクリーニングしました。その結果、2025 年に架空引用を含む論文の数は 2023 年と比較して 12 倍に増加し、問題が急速に悪化していることが示されました。調査では 1 億 2,500 万件の引用を精査し、そのうち 9,700 万件の有効な識別子を持つ参照を大規模言語モデルを用いて分析しました。論文タイトルと参照先が示す文献タイトルとの不一致を検出する仕組みを採用し、さらに複数の学術データベースで検索を行って実在確認を行いました。結果、2,564 編の論文が少なくとも 1 件、246 編が 3 件以上の架空引用を含んでいることが特定されました。監査で特定された数は真の規模の下限を示しており、実際の被害はさらに甚大である可能性が強いとトパズ氏は指摘しています。この現象が生成 AI による自動生成によるものであるか、人間の悪意によるものかは現時点で未解明ですが、問題の急激な増加は AI の関与を示唆しているとしています。また、人工的な引用が科学的文献を汚染している現状に対して、専門家は懸念を表明しています。ロンドンに拠点を置くデジタルサイエンス社科学計測部長のキャサリン・ウェーバー=ボア氏も、この研究が問題解決に向けた重要な第一歩であると評価しています。ただし、Google ショラーなどの既存のデータベースが検証手段として完全ではない点や、架空の文献が実在するかのように表示されるケースがあるため、実際の被害規模はさらに過小評価されている可能性があると指摘されています。

関連リンク

250 万件の生物医学論文審査、偽引用の急増が判明 | 人気の記事 | HyperAI超神経