
배경:생물의학 연구 출판물에서 관계나 사건을 추출하는 것이 지식 캡처와 합성을 지원하는 데 중요한 역할을 하며, 이러한 정보 추출 작업에 대한 접근 방식이 문법 정보에 크게 의존하기 때문에, 생물의학 텍스트의 문법 처리에 있어 가장 높은 성능을 보이는 접근 방식을 이해하는 것이 가치가 있습니다.결과:우리는 두 개의 기준 생물의학 말뭉치인 GENIA와 CRAFT를 사용하여 자연어 처리의 두 핵심 작업인 품사 태깅(Part-of-Speech, POS)과 종속성 구문 분석(dependency parsing)에 대해 최신 전통적인 특징 기반 모델과 신경망 기반 모델을 비교하는 실증적 연구를 수행했습니다. 우리所知에 따르면, 최근에는 이러한 비교를 생물의학 맥락에서 수행한 연구가 없으며, 특히 이 데이터에 대한 신경망 모델의 상세 분석이 제공되지 않았습니다. 실험 결과는 일반적으로 신경망 모델이 GENIA와 CRAFT 두 기준 생물의학 말뭉치에서 특징 기반 모델보다 우수한 성능을 보임을 나타냈습니다. 또한 우리는 하류 응용 프로그램인 생물의학 사건 추출에서 이러한 모델들의 영향력을 조사하기 위한 과제 지향 평가를 수행했으며, 내재적 구문 분석 성능이 우수하다고 항상 외재적 사건 추출 성능이 우수하지 않다는 것을 보여주었습니다.결론:우리는 생물의학 맥락에서 품사 태깅과 종속성 구문 분석을 위한 전통적인 특징 기반 모델과 신경망 기반 모델을 비교하는 상세한 실증적 연구를 제시하였으며, 하류 작업인 생물의학 사건 추출에서 파서 선택의 영향력도 조사하였습니다.자료 및 재료의 이용 가능성:우리는 재훈련된 모델들을 https://github.com/datquocnguyen/BioPosDep 에 공개합니다.