
本研究では、ガウス条件付き随機場(Gaussian Conditional Random Fields: G-CRF)と深層学習の長所を組み合わせた構造予測手法を提案します。以下の特徴が本手法に含まれています:(a) 構造予測タスクには一意の全局最適解があり、線形システムの解から正確に得られます。(b) モデルパラメータの勾配は、閉形式表現を使用して解析的に計算されます。これに対し、現代の深層構造予測アプローチは時間遡及誤差逆伝播法(back-propagation-through-time)に依存しており、メモリ消費が大きいという問題があります。(c) 対象間項は、DenseCRFを基にした研究で見られるような単純な手作りの式である必要はありません。むしろ、データから深層構造を通じて「発見」される可能性があります。(d) また、当システムはエンドツーエンドで訓練することができます。数値解析の標準的な手法に基づいて、推論と学習用の非常に効率的なアルゴリズムを開発しました。さらに、セマンティックセグメンテーションタスクに適応したカスタマイズされた技術も開発しています。この効率性により、深層学習における構造予測のためより洗練されたアーキテクチャを探索することが可能になりました。多分解像度アーキテクチャを導入し、異なるスケール間での情報を結合する共同最適化フレームワークを実現することで、体系的な改善が達成されました。我々の手法の有用性をVOC PASCAL 2012画像セグメンテーションベンチマークという難問で示し、強力なベースラインに対して大幅な改善が確認されました。当研究に関連するすべてのコードと実験結果は{https://github.com/siddharthachandra/gcrf}で公開されています。