2달 전

계층적 라벨별 주의 네트워크와 라벨 임베딩 초기화를 사용한 설명 가능한 임상 노트 자동 코딩

Hang Dong; Víctor Suárez-Paniagua; William Whiteley; Honghan Wu
계층적 라벨별 주의 네트워크와 라벨 임베딩 초기화를 사용한 설명 가능한 임상 노트 자동 코딩
초록

임상 노트의 진단 또는 절차 코드화는 환자의 질병 관련 정보를 코드로 요약하는 것을 목표로 합니다. 이러한 코드화는 일반적으로 병원에서 수작업으로 이루어지지만, 의료 코드화의 효율성과 정확성을 향상시키기 위해 자동화될 가능성이 있습니다. 최근 자동 의료 코드화를 위한 딥 러닝 연구에서는 유망한 성능을 달성하였습니다. 그러나 이러한 모델들의 설명력은 보통 부족하여 임상 실무를 지원하는 데 신뢰성 있게 사용되는 것을 방해하고 있습니다. 또한 이들 모델은 대부분 라벨 간 독립성을 가정하며, 의료 코드 간의 복잡한 상관관계를 무시하는데, 이는 성능 향상을 위해 활용될 수 있는 잠재적인 요소입니다.우리는 각 라벨에 관련된 단어와 문장의 중요도(주의 가중치)를 측정하여 모델을 해석하기 위해 계층적 라벨별 주의 네트워크(Hierarchical Label-wise Attention Network, HLAN)를 제안합니다. 두 번째로, 우리는 주요 딥 눴닝 모델들을 강화하기 위해 라벨 임베딩(Label Embedding, LE) 초기화 방법을 제안합니다. 이 방법은 밀집되고 연속적인 벡터 표현을 학습한 후 이를 모델의 최종 계층과 라벨별 주의 계층에 주입합니다.우리는 MIMIC-III 퇴원 요약 데이터셋에서 세 가지 설정(전체 코드, 상위 50개 코드, 영국 NHS COVID-19 차폐 코드)을 사용하여 방법들을 평가하였습니다. 실험에서는 HLAN과 LE 초기화 방법이 최신 신경망 기반 방법들과 비교되었습니다. HLAN은 상위 50개 코드 예측에서 가장 우수한 마이크로 수준 AUC와 $F_1$ 값을 달성하였으며, NHS COVID-19 차폐 코드 예측에서도 다른 모델들과 유사한 결과를 보였습니다. 각 라벨에 대해 가장 중요한 단어와 문장을 강조함으로써 HLAN은 하위 기준선 및 CNN 기반 모델들보다 더 의미 있고 포괄적인 모델 해석을 보여주었습니다. LE 초기화는 일관되게 대부분의 딥 러닝 모델들의 자동 의료 코드화 성능을 향상시켰습니다.

계층적 라벨별 주의 네트워크와 라벨 임베딩 초기화를 사용한 설명 가능한 임상 노트 자동 코딩 | 최신 연구 논문 | HyperAI초신경