2日前

言語誘導型チューニング:テキストフィードバックを活用した数値最適化の向上

Yuxing Lu, Yucheng Hu, Nan Sun, Xukai Zhao
言語誘導型チューニング:テキストフィードバックを活用した数値最適化の向上
要約

構成最適化は機械学習において依然として重要な課題であり、モデルアーキテクチャ、学習戦略、特徴量工学、ハイパーパラメータなど複数の次元を連携して調整する必要がある。従来の手法はこれらの次元を独立して扱い、解釈可能性に欠ける一方、近年の自動化手法は動的適応性および最適化意思決定に関する意味論的推論に課題を抱えている。本研究では、自然言語による推論を通じて構成を知的に最適化するための新規フレームワーク「言語誘導型チューニング(Language-Guided Tuning, LGT)」を提案する。LGTは、訓練の動的挙動や構成間の相互依存関係に関する意味論的理解を提供する、数値最適化を補完する定性的フィードバック信号である「テキスト勾配(textual gradients)」を活用する。LGTは、構成変更の提案を行う「アドバイザー」、進捗の評価を行う「評価者」、意思決定プロセスの最適化を行う「最適化者」という3つの専門的エージェントを協調させ、自己改善型のフィードバックループを構築する。6種類の多様なデータセットを用いた包括的な評価において、LGTは従来の最適化手法に比べて顕著な性能向上を示し、高い解釈可能性を維持しつつ、優れた性能を達成した。