CogTree: شجرة المعرفة للخسارة في توليد الرسم البياني للمشهد دون تحيز

الرسوم البيانية للمناظر هي تجريد معنوي للصور يشجع على الفهم والتفكير البصري. ومع ذلك، تكون أداء إنشاء الرسم البياني للمناظر (SGG) غير مرضٍ عند التعامل مع البيانات المتحيزة في السيناريوهات الحقيقية. تركز الأبحاث التقليدية في مجال التخلص من التحيز بشكل أساسي على دراسة توزيع البيانات بالتساوي أو تعلم نماذج وتمثيلات خالية من التحيز، مما يجعلها تتجاهل العلاقات بين الفئات المتحيزة. في هذا العمل، نحلل هذه المشكلة من منظور معرفي جديد: بناء هيكل معرفي هرمي بشكل آلي من التوقعات المتحيزة واستكشاف هذا الهرم لتحديد العلاقات، مما يجعل العلاقات النادرة تحظى باهتمام أكبر بطريقة تقريبية دقيقة (Coarse-to-Fine). لهذا الغرض، نقترح خسارة جديدة للتخلص من التحيز تُعرف بخسارة شجرة المعرفة (CogTree) لإنشاء الرسم البياني للمناظر الخالي من التحيز. نقوم أولاً ببناء هيكل معرفي يُدعى شجرة المعرفة (CogTree) لتنظيم العلاقات استنادًا إلى توقعات نموذج SGG المتحيز. تقوم شجرة المعرفة (CogTree) بتمييز العلاقات المختلفة بشكل واضح في البداية ثم التركيز على جزء صغير منها التي يمكن الخلط بينها بسهولة. بعد ذلك، نقترح خسارة للتخلص من التحيز خاصة بهذا الهيكل المعرفي، والتي تدعم تمييزًا تقريبيًا دقيقًا للعلاقات الصحيحة. هذه الخسارة مستقلة عن النموذج وتزيد باستمرار من أداء العديد من النماذج الرائدة. يمكن الوصول إلى الكود عبر الرابط: https://github.com/CYVincent/Scene-Graph-Transformer-CogTree.