2ヶ月前

PACTran: PAC-Bayesian メトリクスによる事前学習モデルの分類タスクへの転移可能性の推定

Nan Ding; Xi Chen; Tomer Levinboim; Beer Changpinyo; Radu Soricut
PACTran: PAC-Bayesian メトリクスによる事前学習モデルの分類タスクへの転移可能性の推定
要約

近年、事前学習モデルの増加に伴い、特定の下流分類タスクに最適な事前学習済みチェックポイントを選択する問題がますます注目を集めています。これまでに、選択問題を解決するためにいくつかの方法(例:LEEP, H-score)が提案されてきましたが、これらの方法は学習理論によって十分に裏付けられていないヒューリスティックを用いています。本論文では、PACTranと呼ばれる理論的に根拠のある事前学習モデル選択および転移可能性測定のための指標群を提示します。まず、転移学習設定における最適なPAC-Bayesian境界からPACTran指標を導出する方法を示します。次に、PACTranの3つの指標実装を視覚タスク(VTAB)や言語と視覚(OKVQA)の複合タスクに対して実証的に評価します。結果の分析から、PACTranは既存の選択方法よりも一貫性があり効果的な転移可能性測定であることが示されました。

PACTran: PAC-Bayesian メトリクスによる事前学習モデルの分類タスクへの転移可能性の推定 | 最新論文 | HyperAI超神経