
要約
本研究では、時間とメモリ効率の高い構造予測手法を提案します。この手法は、空間と時間の両方でニューロンの決定を結合します。最近の深層ガウス条件随伴場(Deep Gaussian Conditional Random Fields: GCRFs)の進歩を利用して、密接に接続された時空間グラフ上で正確かつ効率的な推論を行うことが可能であることを示しています。我々が提案する方法「VideoGCRF」は、(a) 効率的であり、(b) 一意的な全局最小値を持ち、(c) 現代のビデオ理解用深層ネットワークと共にエンドツーエンドで訓練できるという特徴があります。時間領域での複数の接続パターンについて実験を行い、セマンティックセグメンテーションとインスタンスセグメンテーションの両タスクにおいて強力な基線モデルに対する経験的な改善を報告します。