3ヶ月前
単一のグラフ畳み込みだけで十分です:効率的なグレースケール画像分類
Jacob Fein-Ashley, Sachini Wickramasinghe, Bingyi Zhang, Rajgopal Kannan, Viktor Prasanna

要約
ドメイン特化型のタスク、例えば合成開口レーダー自動目標認識(SAR ATR)や胸部X線画像分類において、画像分類器はしばしば畳み込みニューラルネットワーク(CNN)に依存している。これらのネットワークは強力ではあるが、実行する演算数が多く、高い遅延を引き起こすため、リアルタイム応用において問題となることがある。多くの画像分類モデルはRGBおよびグレースケールの両方のデータセットに対応できるように設計されているが、グレースケール画像のみを処理する分類器はそれほど多くない。グレースケール画像分類は、医療画像診断やSAR ATRなど、重要な応用分野を有している。こうした背景を踏まえ、本研究では画像のベクトル化された表現を活用した新しいグレースケール画像分類手法を提案する。マルチレイヤーパーセプトロン(MLP)の軽量性を活かし、画像をベクトルとして扱うことにより、グレースケール画像分類という問題を簡素化する。また、バッチ単位で処理を行う単一のグラフ畳み込み層を導入することで、分類精度を向上させるとともに、性能のばらつきを低減している。さらに、本モデル向けにFPGA上にカスタマイズされたアクセラレータを設計し、複数の最適化手法を組み込むことで、性能の向上を図っている。ベンチマーク用グレースケール画像データセットを用いた実験結果から、本手法の有効性が示された。特にMSTARデータセットにおいて、遅延が最大で16倍低減され、SAR ATRおよび医療画像分類の最先端モデルと比較して、競争力あるあるいは優れた性能を達成した。