2ヶ月前
Search-o1: エージェンティック検索強化型大規模推論モデル
Xiaoxi Li, Guanting Dong, Jiajie Jin, Yuyao Zhang, Yujia Zhou, Yutao Zhu, Peitian Zhang, Zhicheng Dou

要約
大規模推論モデル(LRMs)であるOpenAI-o1は、大規模強化学習を通じて印象的な長期段階的推論能力を示しています。しかし、これらの延長された推論プロセスはしばしば知識の不足に悩まされており、頻繁な不確実性と潜在的な誤りにつながっています。この制限に対処するため、Search-o1というフレームワークを導入します。Search-o1は、エージェント型検索拡張生成(RAG)メカニズムとドキュメント内推論モジュールを備えており、LRMsが不確かな知識ポイントに遭遇した際に外部知識の動的取得を可能にします。さらに、取得されたドキュメントの冗長性の問題に対応するため、取得情報の深層分析を行い、それを推論チェーンに注入する前にノイズを最小限に抑えつつ一貫性のある推論フローを維持するための別途ドキュメント内推論モジュールを設計しました。科学、数学、コーディングにおける複雑な推論タスクや6つのオープンドメインQAベンチマークでの広範な実験により、Search-o1の優れた性能が示されています。このアプローチは、複雑な推論タスクにおけるLRMsの信頼性と適用性を向上させ、より信頼性が高く多様な知能システムへの道を開きます。コードは以下のURLで利用可能です: https://github.com/sunnynexus/Search-o1.