17日前

CNNにおける画像分類のためのポイントワイズ畳み込みの複雑性を低減するための改良型スキーム:可除性制約なしのインタリーブドグループフィルタを用いたもの

{Domenec Puig, Hatem Rashwan, Mohamed Abdel-Nasser, Santiago Romani, Joao Paulo Schwarz Schuler}
要約

深層畳み込みニューラルネットワーク(DCNN)を用いた画像分類において、ポイントワイズ畳み込み層のパラメータ数は、前の層から入力されるチャネル数とフィルタ数の積に比例して急速に増加する。従来の研究では、学習能力を維持しつつ、パラメータ数および浮動小数点演算数を大幅に削減できるサブネットワークが、ポイントワイズ畳み込み層に置き換えることが示されている。本論文では、割り切れない場合にも対応可能な「インターリーブ型グループ化フィルタ」を用いた、DCNNにおけるポイントワイズ畳み込みの複雑性低減を改善した手法を提案する。本手法は、各グループが入力チャネルの一部を処理するグループ化ポイントワイズ畳み込みを採用しており、グループごとのチャネル数をハイパーパラメータ Ch として設定する。提案手法のサブネットワークは、中間にインターリーブ層を挟んで接続された2つの連続する畳み込み層 K と L から構成され、出力でそれらを加算する。層 K と L におけるフィルタのグループ数および各グループ内のフィルタ数は、元の入力チャネル数およびフィルタ数を Ch で正確に割り切ることで決定される。従来の手法では、この割り算が正確でない場合、元の層を置き換えることができなかったが、本論文では、入力チャネルの複製と、グループごとのフィルタ数の不均一化を導入することで、非正確な割り算に対応する新たなアルゴリズムを構築した。その結果、従来手法に比べ、浮動小数点演算数を11%、学習可能なパラメータ数を10%さらに削減することができた。本最適化手法は、ベースラインアーキテクチャとしてEfficientNet-B0を用い、CIFAR-10、結腸癌組織学、マラリアの3つのデータセットで分類実験を行った。各データセットにおいて、EfficientNet-B0の学習可能なパラメータ数に対して、それぞれ76%、89%、91%の削減を達成しつつ、テスト分類精度を維持した。