18일 전
논의 구조와 일치된 코드 임베딩을 활용한 자동 ICD 코드 부여
{Wanchun Yang, Bo Sang, Fuxin Zhang, Bozheng Zhang, Shurui Zhang}

초록
국제질병분류(ICD)는 전 세계 보건 통계 및 역학 연구의 기반을 이루는 체계이다. ICD는 건강 상태를 영문자와 숫자로 구성된 코드로 변환하도록 설계되어 있다. 수작업 기반의 코드화는 인력 집약적이며, 전 세계적으로 의료 종사자 부족 문제가 존재함에 따라, 자동 ICD 코드화를 위한 다양한 접근법이 제안되어 왔다. 그러나 기존 연구들은 임상 기록의 담론 구조를 충분히 활용하지 못했으며, 이는 코드 할당에 있어 풍부한 맥락 정보를 제공할 수 있는 잠재력을 지니고 있다. 본 논문에서는 단락 유형 분류 및 단락 유형 임베딩을 활용하여 임상 기록의 담론 구조를 효과적으로 활용한다. 또한, 클래스 불균형 문제와 임상 기록과 ICD 코드 정의 간의 다양한 서술 스타일 차이에 주목한다. 제안하는 통합 임베딩 접근법은 이러한 문제들을 동시에 해결할 수 있다. MIMIC 데이터셋에서의 실험 결과, 제안 모델은 기존 최고 수준의 모든 모델을 크게 앞서는 성능을 보였다. 소스 코드는 https://github.com/discnet2022/discnet 에 공개되어 있다.