8ヶ月前

拡散モデル

監視付き微調整

アプローチ／フレームワーク

コンピュータビジョン

Sun Xiaopeng ; Lin Qinwei ; Gao Yu ; Zhong Yujie ; Feng Chengjian ; Li Dengjie ; Zhao Zheng ; Hu Jie ; Ma Lin

概要

生成拡散モデル（Generative Diffusion Models, DM）は、画像の超解像（Image Super-Resolution, ISR）に広く利用されています。既存の手法の多くは、モデルの最適化のためにDDPMsからのノイズ除去損失を採用しています。本研究では、報酬フィードバック学習を導入して既存のモデルを微調整することで、生成された画像の品質がさらに向上すると主張します。本論文では、報酬フィードバック学習を用いたタイムステップ認識型トレーニング戦略を提案します。具体的には、ISR拡散の初期ノイズ除去段階において、低周波数制約を超解像（Super-Resolution, SR）画像に適用し、構造的な安定性を維持します。後期のノイズ除去段階では、報酬フィードバック学習を使用してSR画像の知覚的および美的品質を向上させます。さらに、報酬ハッキングによって引き起こされるスタイリゼーションを軽減するためにGram-KL正則化を取り入れています。当方法はプラグアンドプレイ形式で任意の拡散ベースのISRモデルに統合することができます。実験結果は、当方法で微調整されたISR拡散モデルがSR画像の知覚的および美的品質を大幅に向上させることを示しており、優れた主観的な結果を得ています。コード: https://github.com/sxpro/RFSR

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

拡散モデル

監視付き微調整

アプローチ／フレームワーク

コンピュータビジョン

Sun Xiaopeng ; Lin Qinwei ; Gao Yu ; Zhong Yujie ; Feng Chengjian ; Li Dengjie ; Zhao Zheng ; Hu Jie ; Ma Lin

概要

生成拡散モデル（Generative Diffusion Models, DM）は、画像の超解像（Image Super-Resolution, ISR）に広く利用されています。既存の手法の多くは、モデルの最適化のためにDDPMsからのノイズ除去損失を採用しています。本研究では、報酬フィードバック学習を導入して既存のモデルを微調整することで、生成された画像の品質がさらに向上すると主張します。本論文では、報酬フィードバック学習を用いたタイムステップ認識型トレーニング戦略を提案します。具体的には、ISR拡散の初期ノイズ除去段階において、低周波数制約を超解像（Super-Resolution, SR）画像に適用し、構造的な安定性を維持します。後期のノイズ除去段階では、報酬フィードバック学習を使用してSR画像の知覚的および美的品質を向上させます。さらに、報酬ハッキングによって引き起こされるスタイリゼーションを軽減するためにGram-KL正則化を取り入れています。当方法はプラグアンドプレイ形式で任意の拡散ベースのISRモデルに統合することができます。実験結果は、当方法で微調整されたISR拡散モデルがSR画像の知覚的および美的品質を大幅に向上させることを示しており、優れた主観的な結果を得ています。コード: https://github.com/sxpro/RFSR

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています