2ヶ月前

ゼロショット多ラベル分類のための意味的多様性学習

Ben-Cohen, Avi ; Zamir, Nadav ; Baruch, Emanuel Ben ; Friedman, Itamar ; Zelnik-Manor, Lihi
ゼロショット多ラベル分類のための意味的多様性学習
要約

画像認識のためのニューラルネットワークモデルを複数ラベルで訓練し、特に未見ラベルの識別を行うことは困難です。特に、多くの意味的に異なるラベルを含む画像に対しては、この課題がより難しくなります。しかし、このタスクは現実世界の多くのケース(例えば自然画像の検索)を表しているため、解決すべき重要な課題です。本研究では、一般的に用いられている単一の埋め込みベクトルだけでは、関連する既知および未知のラベルを正確にランキングすることは不十分であると主張します。本研究では、画像とラベルの意味的多様性をサポートするマルチラベル・ゼロショット学習向けのエンドツーエンドモデル訓練手法を導入します。提案する手法では、特異な損失関数を使用して主要な埋め込みベクトルを訓練した埋め込み行列を使用することを提唱します。さらに、訓練中に高い意味的多様性を持つ画像サンプルの損失関数での重み付けを増やすことで、埋め込み行列の多様性を促進することも提案します。広範な実験結果から、提案手法がタグベースの画像検索におけるゼロショットモデルの品質向上に寄与し、いくつかの一般的なデータセット(NUS-Wide, COCO, Open Images)で最先端(SoTA)の結果を達成することが示されています。