17日前
ScaleDet:スケーラブルなマルチデータセット物体検出器
Yanbei Chen, Manchen Wang, Abhay Mittal, Zhenlin Xu, Paolo Favaro, Joseph Tighe, Davide Modolo

要約
複数データセットのトレーニングは、追加のアノテーションコストをかけずに異種の大規模データセットを有効活用するための実用的な解決策を提供する。本研究では、トレーニングに用いるデータセット数を増やすことで、データセット間での汎化性能を拡張可能なスケーラブルな複数データセット検出器(ScaleDet)を提案する。従来の複数データセット学習手法が、主に手動でのラベル再定義や高度な最適化を用いてデータセット間のラベルを統一していたのに対し、我々はシンプルでありながらスケーラブルな定式化を導入し、複数データセット学習に適した統一された意味的ラベル空間を構築する。ScaleDetは視覚-テキストのアライメントによって学習され、データセット間でのラベル意味の類似性に基づいてラベル割り当てを獲得する。訓練が完了した後、ScaleDetは既視・未視クラスを含む任意の上流(upstream)および下流(downstream)データセットに対して優れた汎化性能を発揮する。本研究では、LVIS、COCO、Objects365、OpenImagesを上流データセットとして用い、Wildにおける物体検出(ODinW)の13のデータセットを下流データセットとして広範な実験を実施した。実験結果から、ScaleDetは同じバックボーンを用いた最先端の検出器を上回る優れた性能を示し、LVISではmAP 50.7、COCOでは58.8、Objects365では46.8、OpenImagesでは76.2、ODinWでは71.8の成績を達成した。