HyperAIHyperAI

Command Palette

Search for a command to run...

画像レベルの教師あり学習を用いた2万クラスの検出

Xingyi Zhou extsuperscript1,2 extsuperscript* Rohit Girdhar extsuperscript1 Armand Joulin extsuperscript1 Philipp Krähenbühl extsuperscript2 Ishan Misra extsuperscript1

概要

現在の物体検出器は、検出データセットの規模が小さいため、語彙量に制限があります。一方、画像分類器は、そのデータセットが大きく収集しやすいことから、より多くの語彙を扱います。本研究では、Detic(Detector with an Expanded Vocabulary via Image Classification)を提案します。これは、検出器の分類器を画像分類データで訓練することで、検出器の語彙量を数万の概念まで拡張する手法です。従来の手法とは異なり、Deticはモデル予測に基づいてボックスに画像ラベルを割り当てる複雑な割り当てスキームを必要としないため、実装が簡単であり、さまざまな検出アーキテクチャやバックボーンとの互換性も高いです。我々の結果は、ボックス注釈がないクラスでも優れた検出器が得られることを示しています。Deticはオープン・ボキャブラリーおよびロングテール検出ベンチマークにおいて従来の手法を上回っています。オープン・ボキャブラリーLVISベンチマークでは、全クラスに対して2.4 mAP(mean Average Precision)、新規クラスに対して8.3 mAPの性能向上を達成しました。標準的なLVISベンチマークでは、全クラスまたは希少クラスのみで評価した場合に41.7 mAPを得ており、サンプル数が少ない物体カテゴリでの性能差を埋めています。初めてにして、ImageNetデータセットの21,000クラス全てを使用して検出器を訓練し、微調整なしで新しいデータセットに一般化することを示しました。コードは\url{https://github.com/facebookresearch/Detic}から入手可能です


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
画像レベルの教師あり学習を用いた2万クラスの検出 | 記事 | HyperAI超神経