
ディープラーニング革命以前は、多くの認識アルゴリズムが実行時の最適化と強力な事前情報/正則化ペナルティに基づいていました。コンピュータビジョンにおける代表的な例は、オプティカルフローとシーンフローです。教師あり学習は、明示的な正則化の必要性を大幅に置き換えてきました。代わりに、これらの方法では大量のラベル付きデータを使用して事前統計を捉えますが、多くの問題に対してそのようなデータが常に容易に入手できるわけではありません。ニューラルネットワークの重みは実行時に固定されるため、これらの学習ソリューションはドメイン固有であり、他の統計的に異なるシナリオには十分に汎化しません。本論文では、主に実行時の最適化と強力な正則化に依存するシーンフロー問題を見直します。ここでの中心的な革新点は、ニューラルネットワークのアーキテクチャを新しい種類の暗黙的な正則化として使用する「ニューラルシーンフロープライア」の導入です。学習ベースのシーンフロー手法とは異なり、最適化は実行時に行われ、当方針ではオフラインデータセットが必要ありません -- これにより自動運転などの新環境への展開が理想的になります。我々は、多層パーセプトロン(MLP)のみを使用したアーキテクチャがシーンフロープライアとして使用できることを示します。当手法はシーンフローベンチマークで競合他社と同等かそれ以上の結果を得ています。また、当方針の暗黙的かつ連続的なシーンフローレpresentationにより、ポイントクラウドのシーケンス間で密集した長期対応関係を推定することができます。密集した運動情報を表現するためにシーンフローフィールドを使用し、運動ベクトルを積分することで時間的にポイントを伝播させることができます。このような能力をLiDARポイントクラウドのシーケンスを集積することによって示しています。注:「representation」は「表現」と訳しましたが、「表現形式」や「表現方法」などでも良いかもしれません。また、「competitive -- if not better -- results」部分については、「競合他社と同等かそれ以上の結果」と訳しましたが、「競合他社と同等か優れた結果」でも可能です。