해당 기준에 따라 한국어로 답변드리겠습니다. 의사처럼 행동하기: 해부학적 영역에 걸쳐 방사선 검사 보고서 생성

영상의학 보고서 자동 생성은 영상의학 전문의의 보고서 작성 부담을 줄일 수 있다. 그러나 기존 연구들은 다른 해부학적 부위에 비해 공개 데이터셋이 제한적이라는 점에서 주로 흉부 영역에 집중하고 있다. 게다가 대부분은 단순한 데이터 기반 접근 방식에 의존하며, 예를 들어 캡셔닝 손실을 사용하는 기본적인 인코더-디코더 아키텍처를 활용함으로써 다양한 해부학적 부위에서 복잡한 패턴을 인식하는 능력이 제한된다. 이러한 문제를 해결하기 위해, 본 연구에서는 6개 해부학적 부위에 걸쳐 영상의학 전문의의 사고 방식을 반영하는 보고서 생성 프레임워크인 X-RGen을 제안한다. X-RGen은 인간 영상의학 전문의의 행동을 모방하기 위해 네 가지 주요 단계로 구성된다: 1) 초기 관찰, 2) 다부위 간 분석, 3) 의학적 해석, 4) 보고서 작성. 먼저, 영상 전처리를 위한 이미지 인코더를 도입하여 영상의학 전문의의 초진 검토 과정과 유사한 특징 추출을 수행한다. 둘째, 다양한 부위의 영상과 보고서를 통합 분석함으로써 이미지 인코더의 인식 능력을 강화하여, 과거 사례를 통해 경험을 쌓고 전문 능력을 향상시키는 영상의학 전문의의 학습 과정을 모방한다. 셋째, 영상의학 전문의가 영상 해석에 전문 지식을 적용하는 것처럼, 다양한 해부학적 부위의 영상의학 지식을 도입하여 임상적 관점에서 특징을 추가로 분석한다. 마지막으로, 임상 인지 특징을 기반으로 전형적인 자기 회귀 텍스트 디코더를 사용하여 보고서를 생성한다. 자연어 생성(NLG) 및 임상적 효과성 지표를 통한 실험 결과, X-RGen은 6개의 X선 데이터셋에서 우수한 성능을 보였다. 본 연구의 코드와 체크포인트는 다음 링크에서 제공된다: https://github.com/YtongXie/X-RGen.