弱教師ありアクションセグメンテーション
弱教師付き行動セグメンテーション(トランスクリプト)は、コンピュータビジョンのサブタスクの一つで、行動シーケンスの高レベルな説明(例えば、テキストトランスクリプト)のみを使用して、動画内の行動を時間的に分割することを目指しています。このタスクの目的は、大量の詳細にアノテーションされたデータに依存せずに、動画内での様々な行動の開始時刻と終了時刻を正確に識別し、位置特定することです。弱教師付き行動セグメンテーションは、データアノテーションのコストを大幅に削減し、モデルの汎化能力を向上させるため、ビデオ理解、行動分析、ヒューマンコンピュータインタラクションなどのアプリケーションにおいて価値があります。