13日前
イベントベース行動認識のための時系列二値表現
Simone Undri Innocenti, Federico Becattini, Federico Pernici, Alberto Del Bimbo

要約
本稿では、イベントカメラの出力を従来のコンピュータビジョンアルゴリズムが処理可能なフレーム形式に変換するためのイベント集約戦略を提案する。本手法は、まず中間的なバイナリ表現の系列を生成し、その後、単純なバイナリから10進数への変換を適用することで、損失のない形でコンパクトな形式に変換する。この戦略により、時間情報をピクセル値に直接符号化することが可能となり、その結果得られたデータは深層学習モデルによって解釈される。本戦略(Temporal Binary Representation)を指紋認識(Gesture Recognition)のタスクに適用したところ、代表的なDVS128 Gestureデータセットにおいて、最先端の性能を達成した。既存手法との比較を通じて本手法の有効性を強調するため、より厳しい条件下でデータセットを拡張し、その上で実験を実施した。