2ヶ月前

思考過程のダイナミクスの分析：能動的誘導か、不誠実な後向きの合理化か？

Samuel Lewis-Lim Xingwei Tan Zhixue Zhao Nikolaos Aletras

要約

最近の研究では、チェーン・オブ・シンキング（CoT）が分析的・常識的推論など、ソフトリーズニング問題においてしばしば限られた効果しかもたらさないことが示されている。また、CoTはモデルの実際の推論過程と一致しない場合もあり、信頼性に欠けることがある。本研究では、指示チューニング済みモデル、推論向けモデル、および推論蒸留済みモデルの3種類について、ソフトリーズニングタスクにおけるCoTの動態と信頼性を調査した。その結果、これらのモデルがCoTに依存する仕方には差が見られ、CoTの影響力と信頼性が常に一致するわけではないことが明らかになった。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング

すぐに使える GPU

最適価格

今すぐ始める

Hyper Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

思考過程のダイナミクスの分析：能動的誘導か、不誠実な後向きの合理化か？

Samuel Lewis-Lim Xingwei Tan Zhixue Zhao Nikolaos Aletras

要約

AI で AI を構築

Hyper Newsletters