
我々は、逐次的グラフ畳み込みネットワーク(Sequential GCN)を基盤とする新たなプールベースのアクティブラーニングフレームワークを提案する。データプール内の各画像の特徴量をグラフ内のノードとして表現し、エッジはそれらの類似度を符号化する。初期にランダムにサンプリングされた少数の画像をラベル付きの初期例(seed labelled examples)として用い、二値交差エントロピー損失を最小化することで、ラベル付きノードとラベルなしノードを区別するためのグラフパラメータを学習する。GCNはノード間でメッセージ伝達を行うため、強く関連するノードに対して類似した表現を生成する。この特性を活かし、ラベル付きデータと十分に異なるラベルなしサンプルを選定する。そのために、グラフノードの埋め込み表現とその信頼度スコアを用い、CoreSetや不確実性に基づく手法など、さまざまなサンプリング戦略を適応してノードをクエリする。新たにクエリされたノードのラベルを「ラベルなし」から「ラベル付き」に反転し、学習器を再学習して下流タスクを最適化するとともに、グラフモデルも修正された目的関数を最小化するよう再最適化する。このプロセスを固定された予算内において繰り返す。本手法は、4つの実画像分類、1つの深度情報に基づく手のポーズ推定、および1つの合成RGB画像分類の合計6つのベンチマークで評価された。その結果、VAAL、Learning Loss、CoreSetなど複数の競争的ベースラインを上回り、複数の応用において新たなSOTA(最良の状態)性能を達成した。実装コードは以下のリンクから入手可能である:https://github.com/razvancaramalau/Sequential-GCN-for-Active-Learning