HyperAI초신경
2일 전

테스트 시기 확산을 갖춘 딥 리서처

Rujun Han; Yanfei Chen; Zoey CuiZhu; Lesly Miculicich; Guan Sun; Yuanjun Bi; Weiming Wen; Hui Wan; Chunfeng Wen; Solène Maître; George Lee; Vishy Tirumalashetty; Emily Xue; Zizhao Zhang; Salem Haykal; Burak Gokturk; Tomas Pfister; Chen-Yu Lee
테스트 시기 확산을 갖춘 딥 리서처
초록

대규모 언어 모델(Large Language Models, LLM)을 기반으로 한 심층 연구 에이전트는 빠르게 발전하고 있지만, 일반적인 테스트 단계 확장 알고리즘을 사용하여 복잡하고 장문의 연구 보고서를 생성할 때 성능이 정체되는 경우가 많다. 인간 연구의 반복적 특성, 즉 탐색, 추론, 수정의 주기를 영감을 받아, 우리는 테스트 단계 확산 심층 연구자(Test-Time Diffusion Deep Researcher, TTD-DR)를 제안한다. 이 새로운 프레임워크는 연구 보고서 생성을 확산 과정으로 개념화한다. TTD-DR은 연구 방향을 안내하는 진화 가능한 기반으로 작동하는 업데이트 가능한 초안( preliminary draft)을 통해 이 과정을 시작한다. 이 초안은 각 단계에서 외부 정보를 포함하는 검색 메커니즘을 통해 동적으로 정보가 제공되는 '노이즈 제거' 과정을 통해 반복적으로 개선된다. 또한, 에이전트 워크플로우의 각 구성 요소에 적용되는 자기 진화 알고리즘을 통해 핵심 과정이 더욱 강화되어, 확산 과정에 필요한 높은 수준의 맥락 정보를 보장한다. 이러한 초안 중심의 설계는 연구 보고서 작성 과정을 더욱 실시간적이고 일관성 있게 만들며, 반복적 탐색 과정 중 정보 손실을 줄인다. 우리는 TTD-DR이 복잡한 탐색과 다단계 추론이 필요한 다양한 기준(test benchmarks)에서 최상의 성능을 보임을 입증하며, 기존의 심층 연구 에이전트에 비해 훨씬 우수한 결과를 얻고 있음을 보여준다.