시퀀스 및 최단 의존 경로를 이용한 계층적 RNN을 통한 약물-약물 상호작용 추출
동기약물-약물 상호작용(Drug-Drug Interaction, DDI)으로 인한 부작용은 심각한 건강 문제를 초래한다. 생물의학 문헌에 기술된 DDI를 자동으로 추출할 수 있다면, 지속적인 약물 안전성 모니터링(Pharmacovigilance) 노력에 기여할 수 있다. 기존의 대부분의 신경망 기반 방법들은 주로 문장 시퀀스에 초점을 맞추어 DDI를 식별하지만, 두 개체 간의 최단 의존 경로(Shortest Dependency Path, SDP)에는 중요한 구문적 및 의미적 정보가 포함되어 있다. 이러한 정보를 효과적으로 활용하면 DDI 추출 성능을 향상시킬 수 있다.결과본 논문에서는 SDP와 문장 시퀀스를 통합하여 DDI 추출 작업을 수행하기 위한 계층적 순환 신경망(Hierarchical Recurrent Neural Networks, RNNs) 기반의 방법을 제안한다. 먼저 문장 시퀀스를 세 개의 하위 시퀀스로 분할하고, 하위 RNN 모델을 이용하여 각 하위 시퀀스 및 SDP의 특징 표현을 학습한다. 이후 상위 RNN 모델을 활용하여 문장 시퀀스와 SDP의 특징 표현을 동시에 학습한다. 더불어, DDI 추출 작업에서 핵심 키워드를 식별하고 강화하기 위해 임베딩 주의(Embedding Attention) 메커니즘을 도입하였다. 제안한 방법은 DDI 추출 2013 코퍼스를 이용하여 평가되었으며, 기존 최첨단 방법들과 비교해 경쟁력 있거나 더 우수한 성능을 나타냈다. 실험 결과, 문장 시퀀스와 SDP는 서로 보완적인 관계에 있음을 확인하였고, 이 둘을 통합함으로써 DDI 추출 성능을 효과적으로 향상시킬 수 있음을 입증하였다.