HyperAIHyperAI
منذ 15 أيام

CIFAKE: التصنيف الصوتي للصور وتحديد قابل للتفسير للصور الاصطناعية المُولَّدة بواسطة الذكاء الاصطناعي

Jordan J. Bird, Ahmad Lotfi
CIFAKE: التصنيف الصوتي للصور وتحديد قابل للتفسير للصور الاصطناعية المُولَّدة بواسطة الذكاء الاصطناعي
الملخص

أدى التقدم التكنولوجي الأخير في مجال البيانات الاصطناعية إلى تمكين إنشاء صور بجودة عالية للغاية بحيث لا يمكن التمييز بين الصور الفوتوغرافية الحقيقية والصور المولدة بواسطة الذكاء الاصطناعي (AI). وبما أن موثوقية البيانات وتحقيق المصادقة فيه أمر بالغ الأهمية، فإن هذا المقال يقترح تعزيز قدرتنا على التعرف على الصور المولدة بالذكاء الاصطناعي من خلال الرؤية الحاسوبية. في البداية، تم إنشاء مجموعة بيانات اصطناعية تعكس الفئات العشر المتوفرة في مجموعة CIFAR-10 الحالية باستخدام تقنية التشتت الخفي (latent diffusion)، مما يوفر مجموعة صور مُقارنة للصور الفوتوغرافية الحقيقية. ويتمتع النموذج بقدرة على إنتاج سمات بصرية معقدة، مثل الانعكاسات الواقعية في المياه. تُقدَّم المجموعتان كمشكلة تصنيف ثنائي، تتعلق بتحديد ما إذا كانت الصورة حقيقية أم مولدة بواسطة الذكاء الاصطناعي. ثم يقترح هذا البحث استخدام شبكة عصبية متعددة الطبقات (CNN) لتصنيف الصور إلى فئتين: حقيقية أو مزيفة. وبعد عملية ضبط المعايير (hyperparameter tuning) وتدريب 36 هيكلًا مختلفًا للشبكة، تمكّن النهج الأمثل من تصنيف الصور بدقة تصل إلى 92.98%. وأخيرًا، يُطبَّق في هذا البحث الذكاء الاصطناعي القابل للتفسير من خلال خريطة التنشيط التدريجي للتصنيف (Gradient Class Activation Mapping) لاستكشاف السمات داخل الصور التي تُعد مفيدة للتصنيف. تُظهر النتائج تفسيرات مثيرة للاهتمام، خصوصًا ملاحظة أن الكيان الفعلي في الصورة لا يحتوي على معلومات مفيدة للتصنيف، بل يركز النموذج على العيوب البصرية الصغيرة الموجودة في الخلفية. وتم إتاحة مجموعة البيانات الكاملة التي تم هندستها لهذا البحث، والمعروفة باسم مجموعة CIFAKE، للجمهور البحثي لاستخدامها في الأبحاث المستقبلية.

CIFAKE: التصنيف الصوتي للصور وتحديد قابل للتفسير للصور الاصطناعية المُولَّدة بواسطة الذكاء الاصطناعي | أحدث الأوراق البحثية | HyperAI