11日前

CoordFlow:ピクセル単位ニューラル動画表現のための座標フロー

Daniel Silver, Ron Kimmel
CoordFlow:ピクセル単位ニューラル動画表現のための座標フロー
要約

動画圧縮分野において、低ビットレートで高品質な表現を実現するという目標は長年にわたり重要な課題として残っている。近年の進展により、従来の変換ベース手法に対する有力な代替手段として、インプリシットニューラル表現(INR)の可能性が示されつつある。動画用INRは、ネットワークの出力構造に基づいて、フレーム単位型とピクセル単位型に大別される。ピクセルベース型手法は拡大処理や並列化において優れた性能を発揮する一方で、フレーム単位型手法は全体的な性能において優位性を示している。本研究では、動画圧縮向けに新たなピクセル単位型INR「CoordFlow」を提案する。この手法は他のピクセル単位型INRと比較して最先端の性能を達成し、トップクラスのフレーム単位型手法と同等の性能を示す。CoordFlowは、視覚的に一貫性を持つ複数の層に視覚情報を分解し、各層を専用のネットワークで表現するアプローチに基づいている。各ネットワークはその層の動きを補正するように設計されており、統合された際には、動画シーケンスの教師なしセグメンテーションが副次的な成果として得られる。物体の運動軌跡が視覚的・時系列的な冗長性を補償するための暗黙的な手段として活用される。さらに、本手法は内在的に動画の拡大、安定化、インペイント、ノイズ除去の機能を備えている。

CoordFlow:ピクセル単位ニューラル動画表現のための座標フロー | 最新論文 | HyperAI超神経