17日前
LR-Net:低解像度画像分類のためのブロックベース畳み込みニューラルネットワーク
Ashkan Ganj, Mohsen Ebadpour, Mahdi Darvish, Hamid Bahador

要約
近年、画像分類の分野においてCNNベースのアーキテクチャが特徴の学習・抽出において優れた成果を上げたことから、その人気が高まっている。しかし、最先端モデルをノイズが多く、低品質な画像の分類に適用する際には、画像分類の課題はより困難なものとなる。特に、低解像度であるため、意味のあるグローバルな特徴が欠如しており、モデルが有用な特徴を抽出することが依然として困難である。さらに、高解像度画像の学習にはより多くの層が必要となるため、学習にかかる時間と計算リソースが増大するという問題も生じる。前述した深層ニューラルネットワークにおいて層が深くなるにつれて発生する勾配消失問題に対しても、本研究の手法は効果的に対処している。これらの課題を克服するため、ぼやけた低解像度画像およびノイズを含む画像から、低レベル特徴とグローバル特徴の両方を効果的に学習できる新しい画像分類アーキテクチャを提案した。本アーキテクチャのブロック設計は、性能の向上とパラメータ数の削減を実現するため、Residual Connections(残差接続)およびInceptionモジュールの構造を強く意識して構築されている。また、本手法の有効性を検証するため、MNISTシリーズのデータセットを用いて評価を行った。特に、画像品質が低くノイズが多いことから分類が極めて困難とされるOracle-MNISTデータセットに注目し、詳細な実験を実施した。その結果、提案アーキテクチャが既存の最先端CNNよりも高速かつ高精度であることが実証された。さらに、本モデルの特異な構造的特性により、少ないパラメータ数で優れた分類性能を達成できることが明らかになった。