Command Palette
Search for a command to run...
推論が法則に出会うとき
推論が法則に出会うとき
Junyu Zhang Yifan Sun Tianang Leng Jingyan Shen Liu Ziyin Paul Pu Liang Huan Zhang
Abstract
大規模推論モデル(LRMs)は優れた性能を発揮する一方で、その推論行動はしばしば直感に反し、最適な推論能力を発揮できない場合がある。本稿では、望ましい推論行動を理論的に形式化するため、「推論の法則(Laws of Reasoning, LoRe)」という統一的枠組みを提示する。まず、推論に要する計算量が問題の複雑さに線形に比例するという仮説に基づき、「計算量の法則(compute law)」を提唱する。計算量に加え、精度の観点からも補完的な「精度の法則(accuracy law)」をLoReに拡張する。実際の応用において問題の複雑さを定量化することが困難なことから、本研究ではこれらの法則の2つの性質、単調性(monotonicity)と構成性(compositionality)に着目し、仮説の検証を行う。その結果、LoRe-Benchと呼ばれるベンチマークを導入し、大規模推論モデルに対してこれらの測定可能な性質を体系的に評価する手法を提供する。評価の結果、多数の推論モデルは単調性を満たしているものの、構成性に欠けていることが明らかになった。これに対応して、計算量の法則に従う構成性を強制する効果的なファインチューニング手法を開発した。広範な実証的検証により、計算量の法則への適合度が高いモデルほど、複数のベンチマークにおいて一貫して優れた推論性能を示すことが確認され、また、性質間および法則間における協調効果(synergistic effects)も明らかになった。プロジェクトページ:https://lore-project.github.io/