17日前

スパース概念ボトルネックモデル:対比学習におけるGumbelトリック

Andrei Semenov, Vladimir Ivanov, Aleksandr Beznosikov, Alexander Gasnikov
スパース概念ボトルネックモデル:対比学習におけるGumbelトリック
要約

本稿では、概念ボトルネックモデル(Concept Bottleneck Models: CBMs)を用いた説明可能な分類のための新規アーキテクチャおよび手法を提案する。従来の画像分類タスクにおける最先端(SOTA)手法はブラックボックスとして動作する一方で、解釈可能な結果を提供できるモデルへのニーズが高まっている。このようなモデルは、通常、ターゲットインスタンスに関する追加的な記述(いわゆる「概念」)を用いてクラスラベルの分布を予測するように学習する。しかし、既存のボトルネック手法にはいくつかの制限がある。まず、標準モデルと比較して精度が低く、またCBMの活用には追加の概念セットが必要となる点が挙げられる。本研究では、事前学習済みのマルチモーダルエンコーダおよび新規のCLIPに類似したアーキテクチャからCBMを構築するためのフレームワークを提示する。さらに、「概念ボトルネック層」と呼ばれる新種のレイヤーを導入し、それらの訓練方法として、$\ell_1$損失、対比学習損失、およびGumbel-Softmax分布に基づく損失関数(Sparse-CBM)の3種類を提案する。一方で、最終の全結合層(FC層)は従来通りクロスエントロピー損失で訓練する。CLIPに基づくボトルネックモデルにおいて、スパースな隠れ層を導入することで、明確な精度向上が実現された。これは、概念活性化ベクトルのスパース表現がCBMにおいて意味を持つことを示している。さらに、本研究で提案する「概念行列探索(Concept Matrix Search)」アルゴリズムにより、追加の学習やファインチューニングを一切行わずに、複雑なデータセットにおけるCLIPの予測性能を向上させることができる。実装コードは以下のURLから公開されている:https://github.com/Andron00e/SparseCBM。

スパース概念ボトルネックモデル:対比学習におけるGumbelトリック | 最新論文 | HyperAI超神経