Command Palette
Search for a command to run...
알고리즘적 사고 이론
알고리즘적 사고 이론
MohammadHossein Bateni Vincent Cohen-Addad Yuzhou Gu Silvio Lattanzi Simon Meierhans Christopher Mohri
초록
대규모 언어 모델(LLM)은 복잡한 추론 작업을 해결하는 데 매우 효과적임이 입증되었다. 놀랍게도 이러한 모델의 성능은 이전에 생성된 해답을 반복적으로 개선함으로써 향상될 수 있다. 이러한 맥락에서, 여러 해답을 생성하고 통합하는 추론 계획은 확률적 오라클을 활용한 추론 알고리즘으로 볼 수 있다.본 연구에서는 이러한 추론 알고리즘을 분석하기 위한 이론적 프레임워크를 제안한다. 이 프레임워크는 반복적 개선 및 해답 통합 기법의 핵심 원리를 체계화하여, 더 강력한 추론 방법을 설계하는 기반을 마련한다. 기존 모델 해석 방법이 아키텍처적 특성에 의존하는 것과 달리, 본 연구의 모델은 실험적 증거에 기반하고 있다. 결과적으로, 현재와 미래의 다양한 추론 오라클에 적용 가능한 일반적인 관점을 제공한다.