7일 전

스마트폰 촬영 흉부 X선 사진 분류를 위한 합성 데이터를 활용한 이미지 투영 변환 보정

Chak Fong Chong, Yapeng Wang, Benjamin Ng, Wuman Luo, Xu Yang
스마트폰 촬영 흉부 X선 사진 분류를 위한 합성 데이터를 활용한 이미지 투영 변환 보정
초록

스마트폰으로 촬영한 흉부 X선 사진(CXR)의 병변 탐지를 위한 분류 작업은 이상적인 카메라 위치가 아니기 때문에 발생하는 사영 변환(projection transformation)으로 인해 큰 도전 과제가 된다. 최근에는 문서 사진, 번호판 사진 등 다양한 사진 보정 작업을 위한 보정 기법들이 제안되어 왔다. 그러나 우리는 이러한 기법들이 흉부 X선 사진의 특수한 변환 유형, 이미지 외관, 주석 형식 등과 같은 특성 때문에 모두 CXR 사진에 적합하지 않다는 점을 발견하였다. 본 논문에서는 사영 변환 행렬을 예측함으로써 자동으로 CXR 사진을 보정하는 혁신적인 딥러닝 기반의 사영 변환 보정 네트워크(Projective Transformation Rectification Network, PTRN)를 제안한다. 지식의 범위 내에서 본 연구는 사진 보정을 위한 목표로 사영 변환 행렬을 예측하는 최초의 작업이다. 또한, 실제 데이터 수집의 비용을 줄이기 위해 자연스러운 왜곡, 추가적인 화면 간섭 등 다양한 현실적 요소를 고려하여 합성된 CXR 사진을 생성하였다. 우리는 스탠포드 대학교 머신러닝 그룹이 주최한 ‘CheXphoto’ 스마트폰 촬영 CXR 사진 분류 경연대회에서 제안한 방법을 평가하였으며, AUC 기준으로 0.850의 성능을 기록하여 2위(0.762)를 크게 앞서는 우수한 성과를 달성하였다. 심층적인 분석을 통해 PTRN을 사용함으로써 공간 변형된 CXR 사진에 대한 분류 성능이 고해상도 디지털 CXR 이미지와 동일한 수준에 도달함을 확인하였으며, 이는 PTRN이 CXR 사진에 미치는 사영 변환의 부정적 영향을 완전히 제거할 수 있음을 시사한다.

스마트폰 촬영 흉부 X선 사진 분류를 위한 합성 데이터를 활용한 이미지 투영 변환 보정 | 최신 연구 논문 | HyperAI초신경