2ヶ月前
プラグアンドプレイ トリブランチ可逆ブロックによる画像リスケーリング
Bao, Jingwei ; Hao, Jinhua ; Xu, Pengcheng ; Sun, Ming ; Zhou, Chao ; Zhu, Shuyuan

要約
高解像度(HR)画像は、帯域幅を削減するために低解像度(LR)に縮小されることが多く、その後、元の詳細を復元するために拡大されます。最近の画像リスケーリングアルゴリズムでは、逆可能ニューラルネットワーク(INNs)が用いられており、LRとHR画像間の一対一のマッピングを確保する統一フレームワークが作られています。従来の手法では、双方向ブロックベースの単純な逆可能ブロックを使用して、高周波数情報と低周波数情報を別々に処理することが一般的で、しばしば特定の分布を利用して高周波数成分をモデル化します。しかし、RGBドメインで直接低周波数成分を処理するとチャネル冗長性が発生し、画像再構成の効率が制限されます。これらの課題に対処するため、我々は低周波数ブランチを輝度(Y)と彩度(CbCr)成分に分解し、冗長性を削減しつつ特徴量処理を強化するプラグアンドプレイ型三方向逆可能ブロック(T-InvBlocks)を提案します。さらに、拡大時に高周波数成分に対してゼロマッピング戦略を採用することで、重要なリスケーリング情報をLR画像内に集中させます。我々のT-InvBlocksは既存のリスケーリングモデルにシームレスに統合でき、一般的なリスケーリングタスクだけでなく損失圧縮に関わる状況でも性能向上が見られます。広範な実験により、本方法がHR画像再構成における最先端技術を前進させていることが確認されました。