ManTra-Net: شبكة تتبع التلاعب للكشف عن التزوير الصوري وتحديد موضعه باستخدام ميزات غير طبيعية

للقضاء على التزوير الصوري في الحياة الواقعية، الذي يشمل عادةً أنواعًا مختلفة من التلاعبات المدمجة، نقترح بنية عصبية عميقة موحدة تُسمى ManTra-Net. على عكس العديد من الحلول الحالية، فإن ManTra-Net هي شبكة نهائية (end-to-end) تقوم بالكشف عن التلاعبات وتحديد مواقعها دون الحاجة إلى معالجة مسبقة أو ما بعد المعالجة. وتعتمد ManTra-Net على شبكة كاملة مبنية على التحويلات التلافيفية (fully convolutional network)، وتتعامل مع صور ذات أحجام غير محددة، كما تُعالج العديد من أنواع التزوير المعروفة مثل التلاعب بالتركيب (splicing)، والنسخ-التحريك (copy-move)، والإزالة (removal)، والتعزيز (enhancement)، وحتى الأنواع غير المعروفة. تتميز هذه الورقة بثلاث إسهامات بارزة: أولاً، نصمم مهمة تعلم ذاتي بسيطة ولكن فعالة، لتعلم آثار التلاعب الصوري القوية من خلال تصنيف 385 نوعًا من التلاعب الصوري. ثانيًا، نُصِغ مشكلة تحديد مواقع التزوير على أنها مشكلة كشف الشذوذ المحلي، ونُصمم ميزة Z-score لالتقاط الشذوذ المحلي، ونُقدّم حلًا جديدًا يعتمد على الذاكرة طويلة القامة (LSTM) لتقييم الشذوذ المحلي. ثالثًا، نُجري تجارب تحليلية (ablation experiments) بعناية لتحسين التصميم الشبكي المقترح بشكل منهجي. تُظهر النتائج التجريبية الواسعة كفاءة ManTra-Net العالية في التعميم والمتانة، بالإضافة إلى تفوقها على الحلول الأخرى، ليس فقط في حالات التلاعب الفردية، بل أيضًا في التراكيب المعقدة المتنوعة من التلاعبات.