
要約
最近の単一画像反射除去における深層学習ベースのアプローチは、主に以下の2つの理由から有望な進展を示しています:1) 認識事前学習済み特徴量の利用、2) デュアルストリーム相互作用ネットワークの設計。しかし、情報ボトルネック原理によれば、高レベルの意味的な手がかりは層間伝播过程中で圧縮または破棄されがちです。また、デュアルストリームネットワークでの相互作用は異なる層間でも固定的パターンに従うため、全体的な性能に制限が生じます。これらの課題を解決するために、我々は新しいアーキテクチャである可逆分離ネットワーク(Reversible Decoupling Network: RDNet)を提案します。このネットワークは、可逆エンコーダーを使用して貴重な情報を保護しながら、順方向パスにおいて送信と反射に関連する特徴量を柔軟に分離します。さらに、我々は送信率に応じたプロンプトジェネレーターをカスタマイズし、特徴量を動的に調整することで性能向上を図ります。広範囲にわたる実験により、RDNetが5つの広く採用されているベンチマークデータセットにおいて既存の最先端手法よりも優れていることが示されました。RDNetはNTIRE 2025 単一画像反射除去チャレンジにおいて忠実度および知覚比較の両面で最良の性能を達成しました。我々のコードは https://github.com/lime-j/RDNet で公開されています。注:「層間伝播过程中」は「層間伝播過程の中で」と直訳すると冗長になるため、「層間伝播过程中で」と簡略化しました。