مجموعة بيانات تزوير الوجوه من ForgeryNet
التاريخ
رابط النشر
مجموعة بيانات ForgeryNet عبارة عن معيار كبير وشامل تم إنشاؤه خصيصًا لتحليل التزييف العميق. يحتوي على 2.9 مليون صورة و221,247 مقطع فيديو، تغطي 7 طرق تزوير على مستوى الصورة و8 طرق تزوير على مستوى الفيديو من جميع أنحاء العالم. توفر هذه المجموعة من البيانات للباحثين موارد غنية لدعم أربع مهام على مستوى الصورة والفيديو: تصنيف تزوير الصور، وتحديد موقع التزوير المكاني، وتصنيف تزوير الفيديو، وتحديد موقع التزوير الزمني. تتراوح هذه المهام من الكشف عن تزوير الصور الثنائية إلى متعددة التصنيفات، بالإضافة إلى تحديد المواقع المكانية والزمانية للمناطق المزورة.
إن حجم وتنوع مجموعة بيانات ForgeryNet يجعلها أكبر مجموعة بيانات للتزوير العميق متاحة للعامة حاليًا. المميزات هي كما يلي:
- حجم البيانات: 2.9 مليون صورة، 221,247 مقطع فيديو
- المعالجات: 7 طرق على مستوى الصورة، 8 طرق على مستوى الفيديو
- الاضطرابات: 36 اضطرابًا فرديًا واضطرابات مختلطة أكثر
- التعليقات التوضيحية: 6.3 مليون علامة تصنيف، و2.9 مليون تعليق توضيحي لمنطقة العمل، و221,247 علامة شريحة تزوير زمنية
يمكن استخدامها للمهام الأربع التالية:
- موقع تزوير الوقت: حدد الفترات الزمنية التي تم فيها تزوير مقاطع الفيديو.
- تصنيف تزوير الصور، بما في ذلك التصنيف ثنائي الاتجاه (حقيقي/مزور)، وثلاثي الاتجاه (حقيقي/مزور مقابل طريقة تزوير استبدال الهوية/مزور مقابل طريقة تزوير الحفاظ على الهوية)، وتصنيف متعدد الاتجاهات (حقيقي مقابل 15 طريقة تزوير).
- تحديد موقع التزوير المكاني، يتم تقسيم المناطق التي تم التلاعب بها في الصور المزورة مقارنة بالصور الحقيقية المقابلة.
- تصنيف تزوير الفيديو، إعادة تعريف تصنيف التزوير على مستوى الفيديو ومعالجة الإطارات في مواضع عشوائية.
تم إطلاق مجموعة البيانات بشكل مشترك في عام 2021 من قبل باحثين من SenseTime Research، وجامعة بكين للبريد والاتصالات، ومختبر الذكاء الاصطناعي في شنغهاي، وكلية البرمجيات، وجامعة بيهانغ، وجامعة العلوم والتكنولوجيا في الصين، وS-Lab، وجامعة نانيانغ التكنولوجية.ForgeryNet: معيار متعدد الاستخدامات لتحليل التزوير الشامل".