HyperAIHyperAI

Command Palette

Search for a command to run...

OneNet:チャネル別1次元畳み込みU-Net

Sanghyun Byun Kayvan Shah Ayushi Gang Christopher Apton Jacob Song Woo Seong Chung

概要

最先端のコンピュータビジョンアーキテクチャの多くは、柔軟性と効率的な特徴抽出能力を備えるため、U-Netを活用している。しかし、多解像度畳み込み設計は計算負荷を大幅に増加させ、エッジデバイスへの展開を制限する要因となっている。本研究では、精度を維持しつつエッジアプリケーションに適した、簡略化された代替アーキテクチャとして、1次元畳み込みエンコーダーを提案する。本研究で提唱する新規エンコーダーは、チャネルごとの1次元畳み込みとピクセルアンシューブル(pixel-unshuffle)操作を組み合わせることで、セマンティックセグメンテーションを実現している。ピクセルシューブル(PixelShuffle)を導入することで、超解像処理において精度を向上させつつ計算負荷を低減するという知見を活かし、2次元畳み込みを必要とせずに空間的関係性を捉えることが可能となり、パラメータ数を最大47%削減した。さらに、完全に1次元構造のエンコーダー・デコーダーを検討した結果、サイズを71%削減する一方で若干の精度低下が生じた。本手法は、多様なマスク生成タスクにおいてU-Netの変種と比較して、精度を効果的に維持することを実証した。本アーキテクチャは画像セグメンテーションに焦点を当てているが、他の畳み込みベースの応用にも拡張可能である。本プロジェクトのコードは、https://github.com/shbyun080/OneNet にて公開されている。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています