3ヶ月前

BBN:累積学習を備えた双方向ブランチネットワークによる長尾視覚認識

Boyan Zhou, Quan Cui, Xiu-Shen Wei, Zhao-Min Chen
BBN:累積学習を備えた双方向ブランチネットワークによる長尾視覚認識
要約

本研究は、多数のデータが少数のクラスに集中し、多くのクラスが極めて少ないサンプルしか持たないという、現実的かつ困難な長尾データ分布(long-tailed data distribution)に対する視覚認識タスクに焦点を当てる。既存の研究では、クラスの再バランス戦略(例:重み付けの再調整やサンプリングの再設計)が、長尾問題に起因する極端なクラス不均衡を緩和するための主要かつ効果的な手法として広く提案されている。本論文では、これらの再バランス手法が良好な認識精度を達成する理由は、深層ネットワークにおける分類器学習を顕著に促進する点に起因することを初めて発見した。しかし同時に、これらの手法は学習された深層特徴の表現能力を一定程度損なうという予期せぬ副作用も持つことが明らかになった。この問題に対処するため、表現学習と分類器学習の両方を同時に最適化できる統一的な二重枝ネットワーク(Bilateral-Branch Network, BBN)を提案する。本モデルでは、各ブランチが独立して自らの役割を果たす構造を採用している。特に、本BBNモデルは、普遍的なパターンをまず学習し、その後徐々に末端クラス(tail classes)に注目するという新たな累積学習戦略を組み込んでいる。4つのベンチマークデータセット(大規模なiNaturalistデータセットを含む)における広範な実験により、提案手法のBBNが最先端手法を著しく上回ることを実証した。さらに、検証実験を通じて、本研究の初期発見の妥当性およびBBNにおける長尾問題向けに特化した設計の有効性が裏付けられた。本手法はiNaturalist 2019大規模生物種分類コンペティションで1位を獲得し、実装コードはオープンソースとしてGitHub(https://github.com/Megvii-Nanjing/BBN)にて公開されている。