11日前

アラインとディスティル:ドメイン適応型オブジェクト検出の統合と改善

Justin Kay, Timm Haucke, Suzanne Stathatos, Siqi Deng, Erik Young, Pietro Perona, Sara Beery, Grant Van Horn
アラインとディスティル:ドメイン適応型オブジェクト検出の統合と改善
要約

オブジェクト検出器は、訓練データと異なるデータに対してしばしば性能が低下する傾向がある。近年、ドメイン適応型オブジェクト検出(DAOD)手法がこの課題に対処する上で優れた成果を示している。しかし、本研究では、これまでの成果の信頼性を疑わせる根本的なベンチマーク手法上の問題を指摘する。具体的には、(a) 効果の低いベースラインによる性能の過大評価、(b) 実装方法の不統一による手法間の透明性の欠如、(c) 古いバックボーンネットワークの使用とベンチマークの多様性不足による汎用性の欠如である。これらの課題に対処するために、以下の4つの貢献を提案する:(1) DAOD手法の比較を可能にし、今後の開発を支援する統一されたベンチマークと実装フレームワーク「Align and Distill(ALDI)」の導入、(2) ベンチマークの問題点を解消する公正かつ最新のDAOD用訓練・評価プロトコルの設計、(3) 実世界の多様なデータに対する評価を可能にする新規DAODベンチマークデータセット「CFC-DAOD」の公開、(4) 顕著な性能向上を達成する新規手法「ALDI++」の提案。ALDI++は、CityscapesからFoggy Cityscapesへの移行において前例最高(SOTA)を+3.5 AP50、Sim10kからCityscapesへの移行では+5.7 AP50(唯一、公正なベースラインを上回る手法)、CFC KenaiからChannelへの移行では+0.6 AP50でSOTAを達成している。ALDIおよびALDI++はアーキテクチャに依存せず、YOLOおよびDETRベースのDAODにおいても追加のハイパーパラメータチューニングなしに新たなSOTAを設定している。本研究で提供するフレームワーク、データセット、および最先端手法は、DAOD分野における重要な再定義をもたらし、今後の研究に強固な基盤を提供する。コードとデータは以下のリンクから公開されている:https://github.com/justinkay/aldi および https://github.com/visipedia/caltech-fish-counting。

アラインとディスティル:ドメイン適応型オブジェクト検出の統合と改善 | 最新論文 | HyperAI超神経