2ヶ月前

意味の混乱の解消による改善されたゼロショット検出

Sandipan Sarma; Sushil Kumar; Arijit Sur
意味の混乱の解消による改善されたゼロショット検出
要約

ゼロショット検出(ZSD)は、モデルが一部の目標(「未見」)クラスの視覚サンプルで学習されていない場合でも、物体を認識し位置特定するという課題です。最近では、GANなどの生成モデルを用いた手法が優れた結果を示しており、これらの手法では、既知クラスのデータで訓練されたGANによって未見クラスのサンプルがその意味に基づいて生成され、従来の物体検出器が未見の物体を認識できるようになっています。しかし、セマンティックな類似性があるクラス間での区別が困難であるという問題(セマンティック混乱)は依然として存在しています。本研究では、クラス間の相違度を認識し、生成されたサンプルに反映させるためのトリプレット損失を組み込んだ生成モデルの訓練方法を提案します。さらに、循環一貫性損失も導入することで、生成された視覚サンプルが自らの意味と高い対応性を持つことを確保します。MSCOCOおよびPASCAL-VOCという2つのベンチマークZSDデータセットにおける広範な実験により、現在のZSD手法よりも大幅な改善が示され、セマンティック混乱が減少し、未見クラスの検出性能が向上しました。

意味の混乱の解消による改善されたゼロショット検出 | 最新論文 | HyperAI超神経