
要約
我々は、データセット要約のための新しいタスクとして「K個の主要概念同定(K principal concept identification)」を提案する。このタスクの目的は、データセット内の変動を最もよく説明するK個の概念を特定することにある。概念とは、「タイガー」「カヤッキング」「ハッピー」など、人間が直感的に理解可能な高レベルの用語を指す。これらのK個の概念は、入力として与えられる(場合によっては非常に長い)候補概念のリスト(以下、概念バンクと呼ぶ)から選定される。概念バンクは汎用辞書から取得することができる一方、タスク固有の事前知識に基づいて構築することも可能である。画像と概念バンクを、共通の特徴空間に写像するため、画像・言語埋め込み手法(例:CLIP)を用いる。データの変動を最もよく説明するK個の概念を選定するため、本問題を「K無制限施設配置問題(K-uncapacitated facility location problem)」として定式化する。さらに、大規模な概念バンクに対しても効率的に適用可能な最適化手法を用いて、局所探索アルゴリズムのスケーラビリティを向上させる。本手法の出力は、データセットを要約するK個の主要概念の集合である。従来の代表画像K個を選定する要約手法と比較して、本手法はより明確かつ解釈可能な要約を提供する。さらに、本手法はデータセットをK個のグループに分類する応用にも活用可能である。広範な実験により、本手法の有効性が実証された。