2ヶ月前

使用するバックボーンの選択:コンピュータビジョンにおける効率的なドメイン固有の比較

Pranav Jeevan; Amit Sethi
使用するバックボーンの選択:コンピュータビジョンにおける効率的なドメイン固有の比較
要約

現代のコンピュータビジョン応用において、特に画像分類では、ImageNetなどの大規模データセットで事前学習されたアーキテクチャ・バックボーンが一般的に特徴抽出器として使用されています。これらの事前学習済みの畳み込みニューラルネットワーク(CNN)が広く使用されているにもかかわらず、さまざまなドメインやデータセットサイズにおけるリソース効率の高いバックボーンの性能に関する理解にはまだギャップがあります。本研究では、一貫した訓練設定のもとで、自然画像、医療画像、銀河画像、および遠隔感測画像を含む多様なデータセット上で複数の軽量級の事前学習済みCNNバックボーンを系統的に評価しました。この包括的な分析は、特に小規模データセットを扱う場合や事前学習済みネットワークの微調整が重要なシナリオにおいて、機械学習実践者が自らの特定の問題に最適なバックボーンを選択する際の一助となることを目指しています。注目ベースのアーキテクチャの人気が高まっていますが、低データ微調整タスクではCNNよりも劣る傾向があることが観察されました。また、ConvNeXt、RegNet、EfficientNetなどの一部のCNNアーキテクチャが他のものよりも一貫して多様なドメインで優れた性能を示すことも確認されました。本研究の結果は、異なるバックボーン間での性能トレードオフと効果性に関する具体的な洞察を提供し、幅広いコンピュータビジョン領域におけるモデル選択における情報に基づいた意思決定を支援します。当該コードは以下のURLから入手可能です: https://github.com/pranavphoenix/Backbones

使用するバックボーンの選択:コンピュータビジョンにおける効率的なドメイン固有の比較 | 最新論文 | HyperAI超神経