استعادة الرسوم البيانية للمشهد غير المتحيزة من تلك المتحيزة

بما أن الصور المدخلة، يهدف إنشاء الرسم البياني للمناظر (SGG) إلى إنتاج تمثيلات بيانية شاملة تصف العلاقات البصرية بين الأشياء البارزة. مؤخرًا، تم بذل جهود أكبر لمعالجة مشكلة الذيل الطويل في SGG؛ ومع ذلك، فإن عدم التوازن في نسبة العلامات المفقودة من فئات مختلفة، أو التحيز في الإبلاغ، الذي يزيد من حدة هذه المشكلة نادرًا ما يتم النظر فيه ولا يمكن حلّه باستخدام طرق التعديل الحالية. في هذا البحث، نوضح أن بسبب العلامات المفقودة، يمكن اعتبار SGG كمشكلة "التعلم من البيانات الإيجابية والغير مصنفة" (PU learning)، حيث يمكن إزالة التحيز في الإبلاغ باستعادة الاحتمالات غير المتحيزة من المتحيزة باستخدام تكرارات العلامات، أي نسبة الأمثلة المصنفة بشكل إيجابي لكل فئة من بين جميع الأمثلة الإيجابية. للحصول على تقديرات دقيقة لتكرارات العلامات، نقترح تقدير تكرار العلامات الديناميكي (DLFE) للاستفادة من زيادة البيانات أثناء التدريب وحساب المتوسط عبر عدة عمليات تدريب لإدخال أمثلة أكثر صلاحية. تظهر التجارب الواسعة أن DLFE أكثر فعالية في تقدير تكرارات العلامات مقارنة بمتغير بسيط للمقدر التقليدي، وأن DLFE يخفف بشكل كبير من مشكلة الذيل الطويل ويحقق أداء تعديل رائد على مجموعة بيانات VG. كما نوضح بشكل نوعي أن نماذج SGG مع DLFE تنتج رسومًا بيانية للمناظر أكثر توازنًا وعدم تحيز.