2ヶ月前

グラフニューラルネットワークを用いた高速対話型ビデオオブジェクトセグメンテーション

Varga, Viktor ; Lőrincz, András
グラフニューラルネットワークを用いた高速対話型ビデオオブジェクトセグメンテーション
要約

画像シーケンスの画素単位でのアノテーションは人間にとって非常に手間がかかります。対話型ビデオオブジェクトセグメンテーションは、自動的な手法を利用することでこのプロセスを高速化し、アノテーターの作業負荷を軽減することを目指しています。現代の多くの手法は、ビデオ全体から人間のアノテーション情報を収集および処理するために深層畳み込みネットワークに依存しています。しかし、これらのネットワークには数百万のパラメータが含まれており、過学習を避けるためには大量のラベル付き訓練データが必要です。さらに、ラベル伝播は通常、フレームごとの推論ステップのシリーズとして実行されるため、並列化が難しく、時間がかかるという問題があります。本稿では、対話型ビデオオブジェクトセグメンテーションの問題解決に向けたグラフニューラルネットワークに基づくアプローチを提案します。当社のネットワークはスーパーピクセルグラフ上で動作し、これにより問題の次元性を大幅に削減することができます。我々は実験を通じて示しましたが、数千のパラメータしか持たない当社のネットワークでも最先端の性能を達成できることを確認しました。また、推論速度が速く、少量のデータで迅速に学習できるという利点もあります。