オープンボキャブラリーアクション認識

オープンボキャブラリーアクション認識(OVAR)は、コンピュータビジョン分野における最先端のタスクで、訓練時に見られた事前定義された行動セットを超えることを目指しています。このタスクでは、推論時にテキストクエリを提供することで、訓練段階でこれらの行動に関する事前知識が不要なまま、未見の行動を認識することができます。OVARの応用価値は、より多様で複雑な実世界のシナリオを処理できることにあり、視覚システムの適応性と堅牢性を向上させます。

オープンボキャブラリーアクション認識 | SOTA | HyperAI超神経