放射線科医のように振る舞う:解剖学的領域に跨る放射線科レポート生成

レントゲン画像報告書の自動生成は、放射線科医の報告作業負荷を軽減する可能性を秘めている。しかし、現行の研究は、他の領域に比べて公開データセットが限られていることから、主に胸部領域に焦点を当てている。さらに、多くの研究が単純なデータ駆動型アプローチに依存しており、例えばキャプション損失を用いた基本的なエンコーダ-デコーダフレームワークにとどまっている。このようなアプローチでは、多様な解剖学的領域にまたがる複雑なパターンを正しく認識する能力が制限される。こうした課題に対処するため、本研究では、6つの解剖学的領域にわたる放射線科医に配慮した報告書生成フレームワーク「X-RGen」を提案する。X-RGenでは、人間の放射線科医の行動を模倣することを目的とし、以下の4つの主要な段階に分解する:1)初期観察、2)領域間比較分析、3)医学的解釈、4)報告書作成。まず、画像エンコーダを用いて特徴量を抽出し、放射線科医の初期レビューに類似させる。次に、さまざまな領域の画像と報告書を統合的に分析することで、画像エンコーダの認識能力を強化し、放射線科医が過去の症例から経験を積み、専門的スキルを向上させるプロセスを模倣する。さらに、放射線科医が画像を解釈する際の専門知識を活用し、複数の解剖学的領域に関する放射線学的知識を導入することで、臨床的視点から特徴量をさらに深く分析する。最後に、医療意識を持つ特徴量をもとに、典型的な自己回帰型テキストデコーダを用いて報告書を生成する。自然言語生成(NLG)および臨床効果に関する評価指標の両面で、X-RGenが6つのX線データセットにおいて有効であることが示された。本研究のコードとモデルチェックポイントは、以下のURLから公開されている:https://github.com/YtongXie/X-RGen。