التفتيح القابل للتبديل لتعلم التمثيل العميق

تعد طرق التطبيع مكونات أساسية في شبكات العصبونات المتشابكة (CNNs). فهي إما تقيس البيانات أو تبييضها باستخدام الإحصاءات المقدرة في مجموعات محددة من البكسل. على عكس الأعمال الحالية التي تصمم تقنيات التطبيع لمهام معينة، نقترح البياض القابل للتبديل (SW)، والذي يوفر شكلًا عامًا يوحّد بين مختلف طرق البياض والقياس. يتعلم SW التبديل بين هذه العمليات بطريقة شاملة ومتصلة. له عدة مزايا. أولاً، يقوم SW باختيار تكيفي للإحصاءات المناسبة للبيض أو القياس لمختلف المهام (انظر الشكل 1)، مما يجعله مناسبًا جدًا لمجموعة واسعة من المهام دون تصميم يدوي. ثانيًا، من خلال دمج فوائد مختلف المعياريات، يظهر SW تحسينات مستمرة على نظيراته في مجموعة متنوعة من المقاييس الصعبة. ثالثًا، يعتبر SW أداة مفيدة لفهم خصائص تقنيات البياض والقياس. نوضح أن SW يتفوق على البدائل الأخرى في تصنيف الصور (CIFAR-10/100، ImageNet)، والتقسيم الدلالي (ADE20K، Cityscapes)، وتكييف المجال (GTA5، Cityscapes)، ونقل أسلوب الصورة (COCO). على سبيل المثال، بدون أي تعقيدات إضافية، نحقق أفضل الأداء الحالي بنسبة 45.33% mIoU على مجموعة بيانات ADE20K. يمكن الحصول على الكود من https://github.com/XingangPan/Switchable-Whitening.