HyperAI

Temporal Sentence Grounding

تثبيت الجملة الزمنية (TSG) هو جزء فرعي في مجال الرؤية الحاسوبية يهدف إلى تحديد اللحظات المحددة في مقاطع الفيديو غير المقصوصة من خلال استعلامات اللغة الطبيعية المعطاة. تستخدم هذه المهمة معلومات إشراف على مستويات مختلفة، بما في ذلك الإشراف الضعيف (مجموعة من فئات الأنشطة على مستوى الفيديو)، والإشراف شبه الضعيف (مجموعة من فئات الأنشطة على مستوى الفيديو وبعض التوقيتات المُسَجَّلة للأنشطة)، والإشراف الكامل (جميع فئات الأنشطة والفترات الزمنية المُسَجَّلة في الفيديو غير المقصوص)، لتحسين دقة التحديد وقدرات التعميم. يمتلك تثبيت الجملة الزمنية أهمية تطبيقية كبيرة في استرجاع الفيديو، وفهم المحتوى، والتفاعل بين الإنسان والحاسوب.