التعلم العميق لتوزيع العلامات مع الغموض في التسمية

حققت شبكات العصبونات التلافيفية (ConvNets) أداءً متميزًا في مهام التعرف البصري المختلفة. يعتبر مجموعة التدريب الموسومة بشكل كبير من أهم العوامل التي ساهمت في نجاحها. ومع ذلك، فإن جمع صور تدريب كافية وموسومة بدقة في بعض المجالات مثل تقدير العمر الظاهري، تقدير وضع الرأس، تصنيف متعدد العلامات والتقسيم الدلالي أمرٌ صعب. حظيًا، هناك معلومات غامضة بين العلامات تجعل هذه المهام مختلفة عن التصنيف التقليدي. استنادًا إلى هذا الملاحظة، نحول علامة كل صورة إلى توزيع علامات منفصل، ونتعلم هذا التوزيع عن طريق تقليل الاختلاف الكولباك-لايبлер (Kullback-Leibler divergence) بين التوزيعات المتوقعة والحقيقة باستخدام شبكات العصبونات العميقة. يُستخدم الطريقة المقترحة DLDL (تعلم توزيع العلامات العميق) بكفاءة في الاستفادة من الغموض في العلامات أثناء تعلم الخصائص وتعلم المصنف، مما يساعد على منع الشبكة من الانحراف الزائد حتى عندما تكون مجموعة التدريب صغيرة. تظهر النتائج التجريبية أن الطريقة المقترحة تنتج نتائج أفضل بكثير من أفضل الأساليب الحالية لتقدير العمر وتقدير وضع الرأس. وفي الوقت نفسه، فإنها تحسن أيضًا أداء التعرف في مهام تصنيف متعدد العلامات والتقسيم الدلالي.