이질적인 외부 지식을 기반으로 한 그래프 기반 추론을 통한 일반 지식 질문 응답

일반 지식 기반 질의 응답은 질문에 명시적으로 표현되지 않은 배경 지식이 필요할 때 그 질문에 답하는 것을 목표로 한다. 주요 과제는 외부 지식에서 증거를 확보하고, 그 증거를 바탕으로 예측을 수행하는 것이다. 최근의 연구들은 인간의 주석을 기반으로 한 증거를 학습하는 방식(수집 비용이 매우 높음)을 채택하거나, 구조화된 또는 비구조화된 지식 기반에서 증거를 추출하는 방식을 사용하지만, 두 가지 출처의 장점을 동시에 활용하지 못하는 한계가 있다. 본 연구에서는 이질적인 지식 출처에서 자동으로 증거를 추출하고, 추출된 증거를 기반으로 질문에 답하는 새로운 접근법을 제안한다. 구체적으로, 구조화된 지식 기반(예: ConceptNet)과 위키백과의 텍스트 데이터를 모두 활용하여 증거를 추출한다. 각 출처에 대해 관계 구조를 반영한 그래프를 구축하고, 이를 바탕으로 그래프 기반의 접근법을 제안한다. 이 접근법은 그래프 기반의 문맥적 단어 표현 학습 모듈과 그래프 기반 추론 모듈로 구성된다. 첫 번째 모듈은 그래프의 구조 정보를 활용하여 단어 간 거리를 재정의함으로써 더 나은 문맥적 단어 표현을 학습한다. 두 번째 모듈은 그래프 컨볼루션 네트워크(GCN)를 사용하여 노드의 이웃 정보를 표현에 통합하고, 그래프 어텐션 메커니즘을 통해 증거를 집계하여 최종 답변을 예측한다. CommonsenseQA 데이터셋에 대한 실험 결과는, 두 가지 지식 출처를 동시에 활용한 본 그래프 기반 접근법이 강력한 기준 모델보다 우수한 성능을 보임을 보여준다. 본 연구 방법은 CommonsenseQA 리더보드에서 최고 성능(75.3%)을 달성하여 최신 기술 수준을 확보했다.