Command Palette

Search for a command to run...

한 달 전

MITS: LLMs를 위한 점별 상호정보를 통한 개선된 트리 탐색 추론

Jiaxi Li Yucheng Shi Jin Lu Ninghao Liu

MITS: LLMs를 위한 점별 상호정보를 통한 개선된 트리 탐색 추론

초록

트리 탐색은 대규모 언어 모델(LLM)의 테스트 시 추론을 위한 대표적인 프레임워크로 자리 잡았으며, 사고의 나무(Tree-of-Thought) 및 몬테카를로 트리 탐색(Monte Carlo Tree Search)과 같은 방법들이 다양한 추론 경로를 탐색하는 데 활용되고 있다. 그러나 중간 추론 단계의 품질에 대해 즉각적이고 신뢰할 수 있는 정량적 평가를 제공하는 것은 여전히 어려운 과제이며, 광범위한 경로 탐색은 계산 비용이 매우 높다. 이를 해결하기 위해 본 연구는 정보이론적 원리를 기반으로 추론을 안내하는 새로운 프레임워크인 상호정보량 트리 탐색(Mutual Information Tree Search, MITS)을 제안한다. MITS는 점별 상호정보량(Pointwise Mutual Information, PMI)을 기반으로 한 효과적인 점수 함수를 도입하여, 비용이 큰 미리보기 시뮬레이션 없이도 비트 기반의 범위 탐색(beam search)을 통해 추론 경로의 단계별 평가 및 탐색 트리 확장을 가능하게 하며, 뛰어난 추론 성능을 달성하면서도 계산 효율성을 유지한다. 이 프레임워크는 불확실성이 높아 탐색이 가장 유익한 추론 단계에 대해 계산 자원을 적응적으로 할당하는 엔트로피 기반의 동적 샘플링 전략과 함께 제공된다. 최종 예측에서는 PMI 점수와 예측 일치도를 결합한 가중 투표 방식을 활용한다. 다양한 추론 벤치마크에서 수행된 포괄적인 실험을 통해 MITS는 기준 방법들을 일관되게 능가하며, LLM 추론을 위한 체계적이고 효율적인 프레임워크를 확립한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
MITS: LLMs를 위한 점별 상호정보를 통한 개선된 트리 탐색 추론 | 연구 논문 | HyperAI초신경