2달 전

MIMIC-III 및 MIMIC-IV에서의 자동 의료 코드화: 비판적 검토 및 재현성 연구

Joakim Edin; Alexander Junge; Jakob D. Havtorn; Lasse Borgholt; Maria Maistro; Tuukka Ruotsalo; Lars Maaløe
MIMIC-III 및 MIMIC-IV에서의 자동 의료 코드화: 비판적 검토 및 재현성 연구
초록

의료 코딩은 임상 자유 텍스트 문서에 의료 코드를 할당하는 작업입니다. 의료 전문가들은 환자의 진단과 치료를 추적하기 위해 이러한 코드를 수동으로 할당합니다. 자동화된 의료 코딩은 이 관리적인 부담을 크게 완화할 수 있습니다. 본 논문에서는 최신의 자동화된 의료 코딩 머신 러닝 모델들을 재현, 비교 및 분석하였습니다. 우리는 여러 모델이 약한 설정, 부적절하게 샘플링된 학습-테스트 분할, 그리고 충분하지 않은 평가로 인해 성능이 저조하다는 것을 보여주었습니다. 이전 연구에서는 매크로 F1 점수가 비최적의 방법으로 계산되었으며, 우리의 수정으로 이 점수가 두 배로 증가했습니다. 우리는 계층별 샘플링과 동일한 실험 환경, 하이퍼파라미터 및 결정 경계 조정을 사용하여 개선된 모델 비교를 제공하였습니다. 우리는 예측 오류를 분석하여 이전 연구의 가정을 검증하고 반증하였습니다. 분석 결과 모든 모델이 드문 코드에 어려움을 겪는 반면, 긴 문서는 미미한 영향만 미치는 것으로 확인되었습니다. 마지막으로, 재현된 모델을 사용하여 새로 발표된 MIMIC-IV 데이터셋에 대한 첫 번째 포괄적인 결과를 제시합니다. 공평한 미래 비교를 위해 우리의 코드, 모델 파라미터, 그리고 새로운 MIMIC-III와 MIMIC-IV 학습 및 평가 파이프라인을 공개합니다.주요 용어:- 의료 코딩 (medical coding)- 자유 텍스트 문서 (free-text documentation)- 매크로 F1 점수 (macro F1 score)- 계층별 샘플링 (stratified sampling)- 하이퍼파라미터 (hyperparameters)- 결정 경계 조정 (decision boundary tuning)- MIMIC-IV 데이터셋 (MIMIC-IV dataset)