Command Palette
Search for a command to run...
AlignMixup: تحسين التمثيلات من خلال الاستيفاء بين الميزات المُحاذاة
AlignMixup: تحسين التمثيلات من خلال الاستيفاء بين الميزات المُحاذاة
Shashanka Venkataramanan Ewa Kijak Laurent Amsaleg Yannis Avrithis
الملخص
يُعدّ "ميكسيب" (Mixup) طريقة قوية لتعزيز البيانات، حيث يتم التداخل بين عنصرين أو أكثر في فضاء المدخلات أو فضاء الميزات، وكذلك بين التسميات المستهدفة المقابلة. وتركز العديد من الطرق الحديثة لـ "ميكسيب" على قص ووضع كائنين أو أكثر داخل صورة واحدة، وهو ما يُعدّ أكثر ارتباطًا بالكفاءة في المعالجة من التداخل الفعلي. ومع ذلك، لا تزال هناك غموض حول أفضل طريقة للتداخل بين الصور. وفي هذا السياق، ارتبطت "ميكسيب" بـ "الآلات التشفيرية التلقائية" (autoencoders)، نظرًا لأن هذه الآلات غالبًا ما "تُنتج تداخلات جيدة"، مثال ذلك إنشاء صورة تتغير تدريجيًا إلى صورة أخرى.في هذا العمل، نعيد النظر في "ميكسيب" من منظور التداخل، ونُقدّم طريقة جديدة تُسمى "ألاينميكسيب" (AlignMix)، حيث نُتمّم التماثل الهندسي بين صورتين في فضاء الميزات. وتمكّن هذه التماثلات من التداخل بين مجموعتين من الميزات، مع الحفاظ على مواقع إحدى المجموعتين. وبشكل مثير للاهتمام، يؤدي هذا إلى حالة تُظهر فيها "ميكسيب" الحفاظ على الشكل أو الوضع (pose) لصورة واحدة، بينما تأخذ نسيج الصورة الأخرى، مما يربطها بشكل مباشر بعملية نقل الأسلوب (style transfer). وأكثر من ذلك، نُظهر أن الآلة التشفيرية التلقائية لا تزال قادرة على تحسين التعلم المعرفي تحت إطار "ميكسيب"، حتى دون أن يرى المصنف (classifier) الصور المُعاد ترميمها أبدًا. وتفوقت "ألاينميكسيب" على أحدث الطرق في مجال "ميكسيب" على خمسة معايير مختلفة.