HyperAIHyperAI
منذ 2 أشهر

العينات غير المصنفة التي تم إنشاؤها بواسطة GAN تحسن أساس التعرف على الشخص في البيئة المخبرية

Zhedong Zheng; Liang Zheng; Yi Yang
العينات غير المصنفة التي تم إنشاؤها بواسطة GAN تحسن أساس التعرف على الشخص في البيئة المخبرية
الملخص

المساهمة الرئيسية لهذا البحث تتمثل في خط أنابيب شبه مشرف بسيط يستخدم فقط مجموعة التدريب الأصلية دون جمع بيانات إضافية. وتتمثل التحديات في 1) كيفية الحصول على المزيد من بيانات التدريب من مجموعة التدريب نفسها، و2) كيفية استخدام البيانات المولدة حديثًا. في هذا العمل، تم استخدام شبكة المولدات التنافسية (GAN) لتوليد عينات غير مصنفة. نقترح تقنية تنظيم تسوية العلامات للأمثلة الشاذة (LSRO). تقوم هذه الطريقة بتعيين توزيع علامات موحد للصور غير المصنفة، مما ينظم النموذج المشرف ويحسن الأساس. قمنا بالتحقق من الطريقة المقترحة على مشكلة عملية: إعادة تحديد الشخص (re-ID). الهدف من هذه المهمة هو استرجاع شخص محدد من كاميرات أخرى. نعتمد على شبكة المولدات التنافسية الإيقاعية العميقة (DCGAN) لتوليد العينات، وعلى شبكة العصبيات المتكررة (CNN) الأساسية لتعلم التمثيل. أظهرت التجارب أن إضافة البيانات التي تم توليدها بواسطة GAN تحسّن بشكل فعّال قدرة التمثيلات المستخرجة بواسطة CNN على التمييز. على ثلاثة مجموعات بيانات كبيرة هي Market-1501 وCUHK03 وDukeMTMC-reID، حصلنا على تحسين بنسبة +4.37٪ و+1.6٪ و+2.46٪ في دقة الرتبة الأولى مقارنة بشبكة CNN الأساسية، على التوالي. بالإضافة إلى ذلك، طبقنا الطريقة المقترحة على تصنيف الطيور بدقة عالية وأحرزنا تقدمًا بنسبة +0.6٪ فوق أساس قوي. يمكن الوصول إلى الكود عبر الرابط https://github.com/layumi/Person-reID_GAN.请注意,"Deep Convolutional Generative Adversarial Network" 通常翻译为 "شبكة المولدات التنافسية الإيقاعية العميقة" 而不是 "الشبكة العصبية المتكررة العميقة للمولدات التنافسية". 同样,“Convolutional Neural Network” 翻译为 “شبكة العصبيات المتكررة” 而不是 “الشبكة العصبية الإيقاعية”. 这些术语在阿拉伯语中已经有通用的翻译方法。因此,我已对这些术语进行了适当的调整。

العينات غير المصنفة التي تم إنشاؤها بواسطة GAN تحسن أساس التعرف على الشخص في البيئة المخبرية | أحدث الأوراق البحثية | HyperAI