HyperAIHyperAI

Command Palette

Search for a command to run...

DRCT:情報ボトルネックから画像スーパーレゾリューションを救う

Chih-Chung Hsu Chia-Ming Lee Yi-Shiuan Chou

概要

近年、低レベルビジョンタスクにおけるVision Transformerベースのアプローチは広範な成功を収めている。CNNベースのモデルとは異なり、Transformerは長距離依存関係をより効果的に捉えることができ、非局所的な情報を利用した画像再構成を可能にする。特に超解像分野では、グローバルな空間情報モデリングが可能であり、シフトウィンドウアテンション機構によって異なるウィンドウ間での情報交換を促進する点で、Swin Transformerベースのモデルが主流となっている。多くの研究者が受容fieldの拡大や精緻なネットワーク設計によりモデル性能を向上させ、顕著な成果を上げている。しかし、我々はネットワークの末端に近づくにつれて特徴マップの強度が急激に小さな値に抑制されるという一般的な現象を観察した。これは情報ボトルネックを示しており、空間情報の喪失を意味し、モデルの潜在能力を間接的に制限していると考えられる。この問題に対処するため、本研究では層間の密な残差接続(dense-residual connections)を導入したDense-residual-connected Transformer(DRCT)を提案する。これにより、空間情報の損失を軽減し、情報フローの安定化を実現することで、モデルの潜在能力を引き出し、情報ボトルネックからの脱却を図っている。実験結果から、提案手法はベンチマークデータセット上で最先端の手法を上回り、NTIRE-2024 Image Super-Resolution(x4)チャレンジにおいても優れた性能を発揮した。本研究のソースコードは以下のURLから公開されている:https://github.com/ming053l/DRCT


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています