
要約
4D Light Field(LF)画像からの深度(視差)推定は、近年の研究テーマとして注目されている。これまでの大多数の研究では、時間情報を考慮せずに静止画像としての4D LF画像からの深度推定に焦点が当てられてきた。本研究では、4D LF動画からの深度推定を目的としたエンドツーエンド型ニューラルネットワークアーキテクチャを提案する。また、深層学習に基づく手法の学習に利用可能な中規模な合成4D LF動画データセットの構築も行った。合成データおよび実世界の4D LF動画を用いた実験結果から、ノイズの多い領域において時間情報を活用することで、深度推定の精度が向上することが明らかになった。データセットおよびコードは以下のURLにて公開されている:https://mediaeng-lfv.github.io/LFV_Disparity_Estimation