
要約
偏微分方程式(PDE)によって記述される物理的知識を活用することは、非教師あり動画予測手法の性能向上に有効なアプローチである。しかし、一般的な動画の全視覚的コンテンツを記述するには物理法則が過度に制約的であるため、本研究ではPDEによる動的挙動と未知の補完的情報を明示的に分離する2本のブランチ構造を備えた深層学習モデル、PhyDNetを提案する。第二の貢献として、データ同化技術に着想を得た新しい再帰型物理セル(PhyCell)を提案し、潜在空間におけるPDE制約付き予測を実現する。4つの異なるデータセットを用いた広範な実験により、PhyDNetが最先端手法を上回る性能を発揮することを示した。消去実験(ablation study)から、情報の分離およびPDE制約付き予測の両方が重要な性能向上をもたらすことが明らかになった。さらに、PhyDNetが欠損データ処理および長期予測において優れた特性を有していることも示した。