HyperAIHyperAI

Command Palette

Search for a command to run...

0.2B軽量モデルが10B級画像インペインティング性能を達成

华中科技大学とVIVO AI Labの研究チームは、高性能な画像インペインティング(欠落部分修復)を実現する超軽量フレームワークMoebiusを開発した。既存の十億級産業用基盤モデルは性能が高いものの計算コストが膨大で実用展開が課題となっており、アーキテクチャの過度な圧縮は表現能力の低下を招くというジレンマが存在していた。この両課題を解決するため、研究チームは拡散モデルのバックボーンを再構築し、空間的文脈とグローバルな意味情報を固定サイズ線形行列に圧縮するLocal-λ Mix Interactionブロックを新設計した。これにより複雑な潜在空間の相互作用を維持しながらパラメータ数を劇的に削減している。さらに、コンパクト化されたモデルの能力を最大化するため、潜在空間内で動作する適応的多粒度蒸留戦略を学習プロセスに組み込んだ。この手法は高コストなピクセル空間復号を回避しつつ、複数の勾配損失を動的に調整することで教師モデルとの高精度な整合性を実現する。実験結果により、Moebiusはわずか0.22億パラメータ(既存の119億パラメータモデルFLUX.1-Fill-Devの2%未満)で推論速度を15倍以上向上させながら、自然画像やポートレートベンチマークにおいて産業用汎用モデルと同等以上の生成品質を達成した。この成果は、高忠実度画像修復処理における計算効率の新基準を提示するものである。

関連リンク

Unknown SourceUnknown Source