HyperAIHyperAI

Command Palette

Search for a command to run...

画像分類におけるOODロバスト性のベイジアンアプローチ

Prakhar Kaushik Adam Kortylewski Alan Yuille

概要

コンピュータビジョンにおける重要な未解決問題の一つは、アルゴリズムが画像ドメインの変化に対して堅牢(ロバスト)であることを保証することである。本研究では、ターゲットドメインの画像にアクセス可能であるが、アノテーションは一切ないという状況を想定し、この問題に取り組む。現実世界におけるOut-of-Domain(OOD)ノイズやオクルージョンが顕著に現れるOOD-CVベンチマークの課題に触発され、物体分類におけるOODロバスト性を向上させるための新しいベイズ的手法を提案する。本研究は、オクルージョンに対しては堅牢であることが示されているコンポジショナルニューラルネットワーク(CompNets)を拡張したものであり、従来のCompNetsはOODデータ上で性能が著しく低下するという課題を克服する。我々は、CompNetsが特徴ベクトルをvon Mises-Fisher(vMF)カーネルによって表現する生成的ヘッド(generative head)を内包していることに着目する。このvMFカーネルは概ね物体の部位に対応しており、教師なし学習によって学習可能である。我々の観察によれば、異なるドメイン間で一部のvMFカーネルは類似している一方で、他のカーネルは異なっている。この性質を活用して、ソースドメインとターゲットドメインの中間的なvMFカーネルの遷移辞書(transitional dictionary)を学習し、ソースドメインのアノテーションを用いてこの辞書上で生成モデルを訓練した後、反復的精緻化(iterative refinement)を施す。このアプローチを「Unsupervised Generative Transition(UGT)」と命名する。UGTは、オクルージョンが存在する状況下でも、OODシナリオにおいて優れた性能を発揮する。UGTは、OOD-CVデータセットをはじめとする複数のOODベンチマーク、代表的なデータセット(例:ImageNet-C [9])、人工的な画像劣化(オクルーダーの追加を含む)、および合成画像から実画像へのドメイン転送(synthetic-to-real domain transfer)といったさまざまな設定で評価された結果、すべてのシナリオにおいて最先端(SOTA)の手法を上回る性能を示した。特に、オクルードされたOOD-CVデータセットでは、トップ1精度で最大10%の向上が達成された。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています