HyperAI超神経

待つ必要はありません!「思考トークン」の削除が推論効率を向上させる

Wang, Chenlong ; Feng, Yuanning ; Chen, Dongping ; Chu, Zhaoyang ; Krishna, Ranjay ; Zhou, Tianyi
公開日: 6/17/2025
待つ必要はありません!「思考トークン」の削除が推論効率を向上させる
要約

最近の大規模推論モデルの進歩により、複雑な段階的な推論が可能になりましたが、しばしば過度な思考を引き起こし、冗長で重複した出力を生成して効率性を阻害しています。本研究では、「Wait(待って)」や「Hmm(うーん)」などのトークンによって示される明示的な自己反省が高度な推論に必要かどうかを検討します。私たちはNoWaitという手法を提案します。これは単純でありながら効果的で、推論時にこれらのトークンを抑制することで明示的な自己反省を無効化します。テキスト、視覚、ビデオ推論タスクにおける10つのベンチマークに対する広範な実験結果から、NoWaitは5つのR1スタイルモデルシリーズにおいて思考経路の長さを最大27%〜51%削減することが示されました。これにより、NoWaitは効率性と有用性を保ちつつ多様なモーダル推論を行うためのプラグアンドプレイソリューションとして機能します。