시제 지식 질문 응답을 위한 추상적 추론 유도

본 연구에서는 대규모 언어 모델(Large Language Models, LLMs)의 시계적 지식 추론 능력을 향상시키는 과제에 초점을 맞춘다. LLMs는 이와 같은 과제에서 종종 어려움을 겪으며, 이로 인해 정확하지 않거나 오해를 유도하는 응답을 생성하게 된다. 이러한 문제는 주로 진술적 지식의 변화를 처리하는 능력이 제한적이며, 복잡한 시계적 논리 구조를 다루는 데 어려움을 겪기 때문이다. 이러한 한계를 극복하기 위해 우리는 '추상적 추론 유도(Abstract Reasoning Induction, ARI)' 프레임워크를 제안한다. 이 프레임워크는 시계적 추론을 두 가지 구분된 단계—지식 독립적(Knowledge-agnostic) 단계와 지식 기반(Knowledge-based) 단계—로 나누어, LLMs에게 사실 기반 지식을 지원하면서도 불필요한 노이즈 데이터의 포함을 최소화한다. 동시에 구성주의(constructivism)의 원리를 기반으로, ARI는 LLMs가 과거의 올바른 및 잘못된 추론 예시로부터 능동적으로 자기주도 학습할 수 있는 능력을 부여한다. 이를 통해 LLMs가 지식과 추론 방법을 능동적으로 구성하도록 교육함으로써, 시계적 추론 능력이 크게 향상된다. 제안하는 방법은 두 개의 시계적 질의응답(QA) 데이터셋에서 각각 29.7%, 9.27%의 상대적 성능 향상을 달성하여, LLMs의 시계적 추론 능력 향상에 있어 뛰어난 효과를 입증한다. 코드는 https://github.com/czy1999/ARI-QA 에서 확인할 수 있다.