مجموعة بيانات تحديد المواقع الزمنية DiDeMo
التاريخ
الحجم
رابط النشر
الترخيص
其他
الفئات

DiDeMo تعني لحظات مميزة يمكن وصفها، والتي يمكن استخدامها لتحديد موقع الأحداث مؤقتًا في مقطع فيديو مع إعطاء وصف باللغة الطبيعية. يتم جمع مقاطع الفيديو الموجودة في مجموعة البيانات من موقع Flickr، ويتم تقطيع كل مقطع فيديو إلى أجزاء تصل مدتها إلى 30 ثانية. يتم تقسيم مقاطع الفيديو الموجودة في مجموعة البيانات إلى أجزاء مدة كل منها 5 ثوانٍ لتقليل تعقيد التعليقات التوضيحية.
تنقسم مجموعة البيانات إلى مجموعات التدريب والتحقق والاختبار، والتي تحتوي على 8,395 و1,065 و1,004 مقطع فيديو على التوالي. تحتوي مجموعة البيانات على إجمالي 26,892 لحظة، وقد تكون اللحظة الواحدة مرتبطة بأوصاف من العديد من المعلقين. تعتبر الأوصاف الموجودة في مجموعة بيانات DiDeMo مفصلة وتتضمن حركات الكاميرا ومقاييس انتقال الوقت والأنشطة. علاوة على ذلك، تم التحقق من صحة الأوصاف الموجودة في مجموعة البيانات هذه بحيث يشير كل وصف إلى لحظة واحدة في الوقت.