3달 전

이질적인 외부 지식을 기반으로 한 그래프 기반 추론을 통한 일반 지식 질문 응답

Shangwen Lv, Daya Guo, Jingjing Xu, Duyu Tang, Nan Duan, Ming Gong, Linjun Shou, Daxin Jiang, Guihong Cao, Songlin Hu
이질적인 외부 지식을 기반으로 한 그래프 기반 추론을 통한 일반 지식 질문 응답
초록

일반 지식 기반 질의 응답은 질문에 명시적으로 표현되지 않은 배경 지식이 필요할 때 그 질문에 답하는 것을 목표로 한다. 주요 과제는 외부 지식에서 증거를 확보하고, 그 증거를 바탕으로 예측을 수행하는 것이다. 최근의 연구들은 인간의 주석을 기반으로 한 증거를 학습하는 방식(수집 비용이 매우 높음)을 채택하거나, 구조화된 또는 비구조화된 지식 기반에서 증거를 추출하는 방식을 사용하지만, 두 가지 출처의 장점을 동시에 활용하지 못하는 한계가 있다. 본 연구에서는 이질적인 지식 출처에서 자동으로 증거를 추출하고, 추출된 증거를 기반으로 질문에 답하는 새로운 접근법을 제안한다. 구체적으로, 구조화된 지식 기반(예: ConceptNet)과 위키백과의 텍스트 데이터를 모두 활용하여 증거를 추출한다. 각 출처에 대해 관계 구조를 반영한 그래프를 구축하고, 이를 바탕으로 그래프 기반의 접근법을 제안한다. 이 접근법은 그래프 기반의 문맥적 단어 표현 학습 모듈과 그래프 기반 추론 모듈로 구성된다. 첫 번째 모듈은 그래프의 구조 정보를 활용하여 단어 간 거리를 재정의함으로써 더 나은 문맥적 단어 표현을 학습한다. 두 번째 모듈은 그래프 컨볼루션 네트워크(GCN)를 사용하여 노드의 이웃 정보를 표현에 통합하고, 그래프 어텐션 메커니즘을 통해 증거를 집계하여 최종 답변을 예측한다. CommonsenseQA 데이터셋에 대한 실험 결과는, 두 가지 지식 출처를 동시에 활용한 본 그래프 기반 접근법이 강력한 기준 모델보다 우수한 성능을 보임을 보여준다. 본 연구 방법은 CommonsenseQA 리더보드에서 최고 성능(75.3%)을 달성하여 최신 기술 수준을 확보했다.