
자동 ICD 코딩은 환자 방문에 국제질병분류 코드를 할당하는 기술로, 청구 작업의 시간과 노동력을 절약할 수 있어 많은 연구 관심을 받고 있습니다. 이전 최신 모델은 문서 표현을 구축하여 ICD 코드를 예측하기 위해 하나의 컨볼루션 계층을 사용했습니다. 그러나 ICD 코딩과 밀접한 관련이 있는 텍스트 조각들의 길이와 문법은 다양한 문서에서 크게 다릅니다. 따라서 평평하고 고정된 길이의 컨볼루션 아키텍처는 좋은 문서 표현을 학습하는 데 한계가 있을 수 있습니다. 본 논문에서는 ICD 코딩을 위한 다중 필터 잔차 컨볼루션 신경망 (Multi-Filter Residual Convolutional Neural Network, MultiResCNN)을 제안합니다. 우리 모델의 혁신적인 특징은 두 가지입니다: 다양한 길이의 텍스트 패턴을 포착하기 위해 다중 필터 컨볼루션 계층을 활용하고, 수용 영역을 확대하기 위해 잔차 컨볼루션 계층을 사용합니다. 우리는 널리 사용되는 MIMIC 데이터셋에서 우리 모델의 효과성을 평가했습니다. MIMIC-III 전체 코드 세트에서 우리 모델은 6개 평가 지표 중 4개에서 최신 모델보다 우수한 성능을 보였습니다. MIMIC-III 상위 50개 코드 세트와 MIMIC-II 전체 코드 세트에서는 모든 평가 지표에서 기존 및 최신 모델들을 모두 능가했습니다. 코드는 https://github.com/foxlf823/Multi-Filter-Residual-Convolutional-Neural-Network 에서 확인할 수 있습니다.