8日前

CascadedGaze:画像修復におけるグローバルコンテキスト抽出の効率性

Amirhosein Ghasemabadi, Muhammad Kamran Janjua, Mohammad Salameh, Chunhua Zhou, Fengyu Sun, Di Niu
CascadedGaze:画像修復におけるグローバルコンテキスト抽出の効率性
要約

画像復元タスクは従来、畳み込みニューラルネットワーク(CNN)に依存してきた。しかし、畳み込み演算子の局所性のため、グローバルな情報を捉えることが困難である。Transformerにおけるアテンション機構の利点は、この問題を回避できる可能性を示唆しているが、その代償として計算量が著しく増加するという課題がある。近年の画像復元分野では、性能と計算コストのバランスを取るため、Transformerの変種を用いた研究が多数進められている。本論文では、エンコーダ・デコーダ構造を採用したCascadedGaze Network(CGNet)を提案する。本手法は、画像復元に向けたグローバル情報を効率的に捉えるための新規かつ効率的なモジュール、Global Context Extractor(GCE)を導入している。GCEモジュールは、自己アテンションを必要とせず、畳み込み層において小さなカーネルを用いることでグローバルな依存関係を学習する。広範な実験結果から、本手法は計算効率に優れながら、合成画像のノイズ除去および単一画像のぼかし除去というタスクにおいて、多数の最先端手法と競合する性能を達成するとともに、実画像のノイズ除去タスクでは性能の限界をさらに押し広げることに成功した。

CascadedGaze:画像修復におけるグローバルコンテキスト抽出の効率性 | 最新論文 | HyperAI超神経