グラウンデッド状況認識

Grounded Situation Recognition(グラウンデッド・シチュエーション・レコグニション)は、コンピュータビジョンの分野におけるタスクで、画像内の主要な活動(動詞)、関連する実体(名詞)、およびそれらのバウンディングボックスの位置を構造化して要約生成することを目指しています。このタスクは、画像内の重要な要素を正確に識別し、位置を特定することで、自動的なシーン理解、コンテンツ検索、および知能型監視に重要な支援を提供します。

グラウンデッド状況認識 | SOTA | HyperAI超神経