BABEL アクション分類データセット

BABEL は、モーションキャプチャ シーケンスで進行中のアクションを記述する言語注釈を備えた大規模なデータセットです。 BABEL には、AMASS データセットからの約 43 時間のモーション キャプチャ シーケンスのアクション アノテーションが含まれています。アクション アノテーションには 2 つの抽象化レベルがあります。シーケンス アノテーションはシーケンス内の全体的なアクションを記述し、フレーム アノテーションはシーケンスの各フレーム内のすべてのアクションを記述します。各フレームの注釈は、モーション キャプチャ シーケンス内の対応するアクションの継続時間と正確に位置合わせされており、複数のアクションを重複させることができます。
データセットには、250 を超える固有のアクション カテゴリを含む 28,000 を超えるシーケンス アノテーションと 63,000 を超えるフレーム アノテーションが含まれています。 BABEL のアノテーションは、動作認識、時間的動作位置特定、動作合成などのタスクに使用できます。