HyperAIHyperAI

Command Palette

Search for a command to run...

FCN-Transformerを用いたポリープセグメンテーションのための特徴量統合

Edward Sanderson Bogdan J. Matuszewski

概要

大腸内視鏡検査は、大腸がん(CRC)の早期発見において広く「ゴールドスタンダード」として認識されている。画像におけるポリープのセグメンテーションは、病変の検出および分類という二つの重要な臨床応用において価値が高く、精度と頑健性の向上に寄与する。しかし、大腸内視鏡画像におけるポリープの手動セグメンテーションは時間と労力を要するため、ディープラーニング(DL)を用いたポリープセグメンテーションの自動化が重要性を増している。一方で、DLベースの手法は過学習に脆弱であり、異なる内視鏡機器によって撮影された画像への一般化能力に欠けることがある。近年、セマンティックセグメンテーションにおいてトランスフォーマーに基づくアーキテクチャは、従来手法を上回る性能と優れた一般化能力を示しているが、入力画像サイズが h×wh \times wh×w の場合、通常は h4×w4\frac{h}{4} \times \frac{w}{4}4h×4w の空間解像度を持つセグメンテーションマップを出力する。このような課題に対応して、本研究では、主ブランチにおいてトランスフォーマーの強みを活かし、セグメンテーションに最も重要な特徴を抽出するとともに、全サイズ予測におけるトランスフォーマーの限界を補うための二次的な完全畳み込みブランチを導入する新たなアーキテクチャを提案する。両ブランチから得られる特徴量は最終的に統合され、h×wh \times wh×w の全サイズセグメンテーションマップが生成される。提案手法は、Kvasir-SEGおよびCVC-ClinicDBの二つのベンチマークデータセットにおいて、mDice、mIoU、mPrecision、mRecallという評価指標において最先端の性能を示した。さらに、各データセットでモデルを学習し、もう一方のデータセットで評価することで、本手法の優れた一般化性能を実証した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています