초록

대규모 추론 모델(Large Reasoning Models, LRMs)의 뛰어난 성능에도 불구하고, 그들의 추론 행동은 종종 직관에 반하는 경향이 있어 최적의 추론 능력을 발휘하지 못하는 경우가 있다. 본 논문은 바람직한 추론 행동을 이론적으로 형식화하기 위해, LRMs 내부의 본질적인 추론 패턴을 특성화하는 통합적 프레임워크인 추론의 법칙(Laws of Reasoning, LoRe)을 제안한다. 먼저, 질문의 복잡도에 비례하여 추론 계산량이 선형적으로 증가해야 한다는 가정을 바탕으로 ‘계산 법칙(Compute Law)’을 제안한다. 계산 외에도, 정확도와 관련된 보완적 법칙인 ‘정확도 법칙(Accuracy Law)’을 LoRe에 확장한다. 실질적으로 질문의 복잡도를 정량화하는 것은 어려우므로, 본 연구는 이 두 법칙의 두 가지 특성—단조성(Monotonicity)과 구성성(Compositionality)—을 통해 가설을 검증한다. 이를 위해 우리는 대규모 추론 모델에 대해 이러한 측정 가능한 특성을 체계적으로 평가할 수 있는 LoRe-Bench라는 벤치마크를 제안한다. 평가 결과, 대부분의 추론 모델은 합리적인 단조성을 보이지만, 구성성은 부족함을 확인하였다. 이러한 문제에 대응하여, 계산 법칙의 구성성을 강제하는 효과적인 미세조정(finetuning) 방법을 개발하였다. 광범위한 실험적 연구를 통해, 계산 법칙에 더 잘 부합하는 모델이 다양한 벤치마크에서 일관되게 향상된 추론 성능을 보이며, 성질과 법칙 간의 상호보완적 효과를 드러냈다. 프로젝트 페이지: https://lore-project.github.io/

소스 PDF 코드 보기