15일 전

다중 사고 체인에 대한 메타이유리로 질문에 답하기

Ori Yoran, Tomer Wolfson, Ben Bogin, Uri Katz, Daniel Deutch, Jonathan Berant
다중 사고 체인에 대한 메타이유리로 질문에 답하기
초록

다중 단계 질문 응답(QA)을 위한 현대적 시스템은 일반적으로 최종 답변에 도달하기 전에 질문을 사고의 연쇄적 단계(chain-of-thought, CoT)로 분해한다. 종종 여러 개의 사고 체인을 샘플링하여 최종 답변에 대해 투표 메커니즘을 통해 통합하지만, 중간 단계 자체는 버려진다. 이러한 접근 방식은 성능을 향상시키지만, 서로 다른 체인 간의 중간 단계 간의 관계를 고려하지 않으며, 예측된 답변에 대한 통합된 설명을 제공하지도 않는다. 본 연구에서는 대규모 언어 모델이 여러 사고 체인에 대해 메타-사고(meta-reasoning)를 수행하도록 유도하는 다중 체인 사고(Multi-Chain Reasoning, MCR)를 제안한다. MCR은 각각의 사고 체인을 분석하고, 체인 간 정보를 혼합하여 설명 생성과 답변 예측 시 가장 관련성이 높은 사실들을 선택한다. MCR은 7개의 다중 단계 QA 데이터셋에서 강력한 기준 모델들을 상회하는 성능을 보였다. 또한 분석 결과, MCR이 생성하는 설명은 높은 품질을 가지며, 인간이 해당 답변의 타당성을 검증하는 데 유용함을 확인하였다.

다중 사고 체인에 대한 메타이유리로 질문에 답하기 | 최신 연구 논문 | HyperAI초신경