16日前

OneNet:チャネル別1次元畳み込みU-Net

Sanghyun Byun, Kayvan Shah, Ayushi Gang, Christopher Apton, Jacob Song, Woo Seong Chung
OneNet:チャネル別1次元畳み込みU-Net
要約

最先端のコンピュータビジョンアーキテクチャの多くは、柔軟性と効率的な特徴抽出能力を備えるため、U-Netを活用している。しかし、多解像度畳み込み設計は計算負荷を大幅に増加させ、エッジデバイスへの展開を制限する要因となっている。本研究では、精度を維持しつつエッジアプリケーションに適した、簡略化された代替アーキテクチャとして、1次元畳み込みエンコーダーを提案する。本研究で提唱する新規エンコーダーは、チャネルごとの1次元畳み込みとピクセルアンシューブル(pixel-unshuffle)操作を組み合わせることで、セマンティックセグメンテーションを実現している。ピクセルシューブル(PixelShuffle)を導入することで、超解像処理において精度を向上させつつ計算負荷を低減するという知見を活かし、2次元畳み込みを必要とせずに空間的関係性を捉えることが可能となり、パラメータ数を最大47%削減した。さらに、完全に1次元構造のエンコーダー・デコーダーを検討した結果、サイズを71%削減する一方で若干の精度低下が生じた。本手法は、多様なマスク生成タスクにおいてU-Netの変種と比較して、精度を効果的に維持することを実証した。本アーキテクチャは画像セグメンテーションに焦点を当てているが、他の畳み込みベースの応用にも拡張可能である。本プロジェクトのコードは、https://github.com/shbyun080/OneNet にて公開されている。

OneNet:チャネル別1次元畳み込みU-Net | 最新論文 | HyperAI超神経