コネクショニストの時間分類
コネクショニスト時間分類(CTC)は、シーケンス間学習タスクにおいて広く使用されている損失関数およびモデリング手法であり、特に入力シーケンスと出力シーケンスの長さが不一致で、アラインメント関係が不明なシナリオで広く使用されています。この手法は2006年に初めて提案され、音声認識、手書き認識、動作認識などの分野で広く使用されています。
CTCの主な目的は、入力シーケンスと出力シーケンス間の明示的なアライメントを必要とせず、入力シーケンスとアライメントされたラベルシーケンスを出力するようにニューラルネットワークモデルを学習することです。空白ラベルと動的計画法アルゴリズムを導入することで、入力シーケンスと出力ラベル間のアライメント関係を自動的に学習し、エンドツーエンドのシーケンスモデリングを実現します。