
초록
다중모달 및 검색 증강형 질문-답변(QA)에 대한 체인-오브-액션(Chain-of-Action, CoA) 프레임워크를 제안한다. 기존 연구와 비교하여 CoA는 현재 QA 응용에서 직면하는 두 가지 주요 과제를 극복한다. 첫째, 실시간 또는 도메인 내 사실과 일치하지 않는 부정확한 환각(hallucination) 문제이며, 둘째, 복합 정보에 대한 약한 추론 성능 문제이다. 본 연구의 핵심 기여는 체계적인 프롬프팅과 사전 설계된 행동을 통해 복잡한 질문을 추론 체인으로 분해하는 새로운 추론-검색 메커니즘을 제안하는 것이다. 방법론적으로, 이질적인 정보 소스로부터 실시간 정보를 검색하기 위해 도메인 적응형 '플러그 앤 플레이(Plug-and-Play)' 행동 세 가지 유형을 제안한다. 또한, 답변 간 충돌을 검증하고 해결하기 위해 다중 참조 신뢰도 점수(Multi-reference Faith Score, MRFS)를 제안한다. 실험적으로 공개 벤치마크와 Web3 사례 연구를 활용하여 CoA가 기존 방법들에 비해 우수한 성능을 보임을 입증한다.