11日前
CheXclusion:深層胸部X線分類器における公平性のギャップ
Laleh Seyyed-Kalantari, Guanxiong Liu, Matthew McDermott, Irene Y. Chen, Marzyeh Ghassemi

要約
近年、機械学習システムは、特に医療画像分野において専門家レベルの性能を達成できる点から注目を集めている。本研究では、X線画像から診断ラベルを予測するための最先端の深層学習分類器が、保護的属性(protected attributes)に偏っている程度を検証する。我々は、3つの代表的な公開胸部X線データセット(MIMIC-CXR、Chest-Xray8、CheXpert)およびこれらのデータセットを統合したマルチサイト集約データセットを用いて、14の診断ラベルを予測する畳み込みニューラルネットワーク(CNN)を訓練した。また、患者の性別、年齢、人種、保険種別(社会経済的地位の代理指標として用いる)といった異なる保護的属性間における真正陽性率(TPR: True Positive Rate)の差異(TPR差異)を評価した。その結果、すべてのデータセット、すべての臨床タスク、およびすべてのサブグループにおいて、最先端分類器にTPR差異が存在することが明らかになった。一方で、マルチソースデータセットでは差異が最小となることが示され、バイアス低減の一つの手段として有効である可能性が示唆された。さらに、TPR差異は、サブグループの疾患負担の割合とは有意な相関を示さないことが分かった。臨床モデルが研究論文から実用製品へと移行する中で、我々は、導入前にアルゴリズムによる差異を慎重に監査するよう、臨床意思決定者に呼びかける。本研究のコードは、https://github.com/LalehSeyyed/CheXclusion にて公開されている。