16일 전

CheXclusion: 딥 흉부 X-ray 분류기에서의 공정성 격차

Laleh Seyyed-Kalantari, Guanxiong Liu, Matthew McDermott, Irene Y. Chen, Marzyeh Ghassemi
CheXclusion: 딥 흉부 X-ray 분류기에서의 공정성 격차
초록

최근 기계 학습 시스템은 의료 영상 분야를 포함한 임상 과제에서 전문가 수준의 성능을 달성할 수 있다는 점에서 큰 주목을 받고 있다. 본 연구에서는 X선 영상에서 진단 레이블을 추출하도록 훈련된 최신의 딥 러닝 분류기가 보호되는 특성(protected attributes)에 대해 얼마나 편향되어 있는지를 검토한다. 우리는 MIMIC-CXR, Chest-Xray8, CheXpert라는 세 가지 주요 공개 흉부 X선 데이터셋과 이들 데이터셋을 다중 기관에서 통합한 다중 소스 데이터셋을 대상으로, 14개의 진단 레이블을 예측하도록 컨볼루션 신경망(Convolutional Neural Networks)을 훈련시켰다. 성별, 연령, 인종, 보험 유형(소득 수준의 대표 지표로 활용)과 같은 다양한 보호 특성 간의 진단 정확도 차이를 측정하기 위해 진단 긍정률(True Positive Rate, TPR)의 차이를 평가하였다. 그 결과, 모든 데이터셋, 모든 임상 과제, 모든 하위군에서 최신 분류기 내에 TPR 편향이 존재함을 입증하였다. 다중 소스 데이터셋은 가장 낮은 편향을 보였으며, 이는 편향을 줄이는 한 가지 방법임을 시사한다. 또한 TPR 편향은 하위군의 질병 부담 비율과 유의미한 상관관계를 보이지 않았다. 임상 모델이 연구 논문에서 실제 제품으로 전환되는 과정에서, 우리는 모델 배포 전에 알고리즘적 편향을 철저히 감사할 것을 임상 의사 결정자들에게 권고한다. 본 연구의 코드는 다음 링크에서 확인할 수 있다: https://github.com/LalehSeyyed/CheXclusion

CheXclusion: 딥 흉부 X-ray 분류기에서의 공정성 격차 | 최신 연구 논문 | HyperAI초신경