
要約
車両の細分化分類は、これまであまり注目されてこなかった困難な研究課題である。本論文では、部位や3Dバウンディングボックスのアノテーションを必要とせずに、車両の細分化分類を実現するための深層ネットワークアーキテクチャを提案する。部位の非教師学習的発見を実現するために、共起層(Co-occurrence layer: COOC層)を導入している。さらに、転移学習とファインチューニングを組み合わせた二段階の手順を採用している。これにより、ImageNetで事前学習された重みを一部の層に適用しつつ、他の層はランダム初期化を行うことで、より効果的なモデルのファインチューニングが可能となる。提案手法はBoxCars116Kデータセットにおいて86.5%の精度を達成し、既存の最先端手法を4%上回った。また、CompCarsデータセットにおいて、70-30および50-50のトレイン-テスト分割においてそれぞれ95.5%および93.19%の精度を達成し、他の手法をそれぞれ4.5%および8%上回った。