9日前
視覚時系列学習のためのディープラジアル埋め込み
{Xilin Chen, Xiujuan Chai, Lei Lei, Xiaotao Wang, Yanan Li, Peiqi Jiao, Yuecong Min}

要約
接続主義的時系列分類(Connectionist Temporal Classification, CTC)は、シーケンス認識において広く用いられる目的関数であり、逐次的なアライメントにより、セグメンテーションされていないシーケンスデータに対して教師信号を提供する。CTCにおける「ブランククラス」は、アライメントプロセスにおいて重要な役割を果たしており、しばしばCTCのピーク性(peaky behavior)の原因とされている。本研究では、CTCの逐次的アライメント機構を維持しつつ、シーケンス特徴量を超球面上に制約する目的関数「RadialCTC」を提案する。各非ブランククラスの学習済み特徴量は、ブランククラスの中心から伸びる径方向の弧上に分布するという明確な幾何学的解釈が可能となり、アライメントプロセスの効率性が向上する。さらに、ブランククラスのロジットを単純に修正することで、ピーク性を効果的に制御できる。認識および局所化に関する実験結果から、RadialCTCが2つのシーケンス認識アプリケーションにおいて有効であることが示された。