ESFPNet:自己蛍光気管鏡動画におけるリアルタイム病変セグメンテーションのための効率的ディープラーニングアーキテクチャ

肺がんは進行した段階で検出される傾向があり、患者の死亡率が高くなる。そのため、近年の研究の多くは早期疾患の検出に注力している。気管支鏡検査は、肺がんの早期兆候(気管支病変)を非侵襲的に効果的に検出するための選択的な手法である。特に、自己蛍光気管支鏡検査(AFB: Autofluorescence Bronchoscopy)は、正常組織(緑色)と病変組織(赤褐色)の自己蛍光特性の違いを色の違いで区別する。近年の研究ではAFBが病変の検出において高い感度を示すことが示されており、気管支鏡検査における重要な手法として注目されている。しかし、AFB動画の手動検査は極めて煩雑で誤りのリスクが高く、自動的なAFB病変解析に関する研究は限定的である。本研究では、リアルタイム処理(27フレーム/秒)を実現する深層学習アーキテクチャ「ESFPNet」を提案する。この手法は、AFB動画ストリームにおける気管支病変の高精度なセグメンテーションと堅牢な検出を可能にする。ESFPNetのアーキテクチャは、事前学習済みのMix Transformer(MiT)エンコーダを活用するエンコーダ構造と、効率的な段階的特徴ピラミッド(ESFP)デコーダ構造を特徴としている。20例の肺がん患者に対するAFB気管支検査動画を用いたセグメンテーション評価では、本手法の平均Dice係数が0.756、平均交差率(IoU)が0.624と、他の最新アーキテクチャと比較して優れた性能を達成した。この結果から、ESFPNetは臨床現場におけるリアルタイムでの病変セグメンテーションおよび検出を可能にする信頼性の高いツールとして医師に有用であることが示された。さらに、CVC-ClinicDB、ETIS-LaribPolypDBデータセットにおいて最先端(SOTA)の性能を示すなど、本モデルは他の分野への応用可能性も示唆されており、KvasirおよびCVC-ColonDBデータセットにおいても優れた性能を発揮している。