i2b2 2010에서의 임상 정보 추출 세 단계에 대한 머신러닝 기반 해결 방안: 최신 동향
목표: 임상 텍스트 마이닝 기술이 지속적으로 발전함에 따라, 환자 치료 및 임상 연구 분야의 혁신을 가능하게 하는 핵심 기술로서의 잠재력이 현실화되고 있다. 이 과정에서 핵심적인 요소는 실제 임상 서술문(임상 내역)에 기반한 자연어 처리(NLP) 방법에 대한 엄격한 벤치마킹 테스트이다. 본 논문에서는 캐나다 국립연구소(National Research Council of Canada)에서 개발한 세 가지 최신 기술 기반 텍스트 마이닝 응용 프로그램이 2010년 i2b2 챌린지 평가에서 수행한 설계 및 성능을 기술하고 있다.설계: 세 가지 시스템은 임상 정보 추출의 세 가지 핵심 단계를 수행한다. (1) 퇴원 요약문 및 진행 기록에서 의학적 문제, 검사, 치료 항목을 추출하는 작업; (2) 의학적 문제에 대한 진술(assertion)을 분류하는 작업; (3) 의학적 개념 간의 관계를 분류하는 작업이다. 이 작업들은 머신러닝 기반 시스템이 텍스트 자체와 외부 자원(UMSL, cTAKES, Medline)에서 도출한 고차원 특징 벡터(대량의 특징 벡터)를 활용하여 수행되었다.측정 방법: 각 하위 작업별 성능은 테스트 세트에서 시스템의 주석과 참조값(ground-truth)을 비교하여 산출된 마이크로 평균 F-스코어(micro-averaged F-scores)를 기준으로 측정되었다.결과: 제출된 모든 시스템 중에서 본 시스템들은 높은 순위를 기록하였으며, 다음과 같은 F-스코어를 달성하였다. 개념 추출: 0.8523(1위), 진술 탐지: 0.9362(1위), 관계 탐지: 0.7313(2위).결론: 모든 작업에서 다양한 특징의 도입이 성공의 핵심 요소임을 확인하였다. 특히, 머신러닝 알고리즘의 선택이 특징 설계의 유연성을 가능하게 하였으며, 과적합(overfitting)을 피하고 계산 자원의 한계에 부딪히지 않으면서도 방대한 수의 특징을 효과적으로 도입할 수 있었다.