18日前

Torchvisionに搭載された事前学習モデルを用いた細粒度種間分類に関する包括的研究

Feras Albardi, H M Dipu Kabir, Md Mahbub Islam Bhuiyan, Parham M. Kebria, Abbas Khosravi, Saeid Nahavandi
Torchvisionに搭載された事前学習モデルを用いた細粒度種間分類に関する包括的研究
要約

本研究は、PyTorchライブラリに搭載されているTorchvisionパッケージに提供されるさまざまな事前学習モデルを調査し、その微細分類画像に対する有効性を検討することを目的としている。転移学習(Transfer Learning)は、訓練データが不足している状況下でも非常に高い性能を達成する有効な手法である。実世界の多くのケースでは、深層ニューラルネットワークモデルを効率的に学習させるために必要な十分なデータを収集することが困難である。転移学習モデルは大規模なデータセットで事前に学習されており、小さなデータセットにおいても著しく短い学習時間で良好な性能を発揮できる。Torchvisionパッケージは、このような小さなデータセットにおける転移学習の適用を可能にする多数のモデルを提供している。したがって、研究者が適切なモデルを選定するためのガイドラインが必要となる。本研究では、10種類のサル種、225種類の鳥類、Fruits 360、Oxford 102 Flowersの4つの異なるデータセットを用いて、Torchvisionに搭載された事前学習モデルの性能を評価した。これらのデータセットは、画像の解像度、クラス数、達成可能な精度がそれぞれ異なり、多様な条件をカバーしている。さらに、各モデルに対して通常の全結合層(fully-connected layer)と、SpinalNetで提案されたSpinal全結合層を適用し、SpinalNetの有効性を検証した。その結果、ほとんどの状況においてSpinal全結合層がより優れた性能を示した。モデル間の公平な比較を確保するため、同一データセットに対してすべてのモデルに同一のデータ拡張(augmentation)手法を適用した。本研究は、今後のコンピュータビジョン分野の研究者が適切な転移学習モデルを選定する際の参考となるものである。

Torchvisionに搭載された事前学習モデルを用いた細粒度種間分類に関する包括的研究 | 最新論文 | HyperAI超神経