HyperAIHyperAI
منذ 13 أيام

التعلم الجزئي العام عبر المُشَرَّح التلقائي الرسومي الثنائي المزدوج

Brian Chen, Bo Wu, Alireza Zareian, Hanwang Zhang, Shih-Fu Chang
التعلم الجزئي العام عبر المُشَرَّح التلقائي الرسومي الثنائي المزدوج
الملخص

نُصِّر مسألة عملية ولكنها صعبة: التعلّم الجزئي العام (GPLL). مقارنةً بالمسألة التقليدية للتعلّم الجزئي (PLL)، فإن GPLL تخفّض افتراض الإشراف من المستوى الفردي — حيث يُعدّ مجموعة من العلامات تُعلّم جزئيًا كائنًا واحدًا — إلى المستوى المجمّع: 1) تُعلّم مجموعة من العلامات جماعة من الكائنات جزئيًا، مع غياب تقييمات الربط بين الكائنات داخل المجموعة والعلامات، و2) يُسمح بوجود روابط بين المجموعات — قد تكون كائنات ضمن مجموعة مرتبطة جزئيًا بمجموعة علامات من مجموعة أخرى. إن هذا النوع من الإشراف المبهم على المستوى المجمّع أكثر واقعية في السياقات الحقيقية، إذ لا يتطلب إضافة تسميات على مستوى الكائنات، مثل تسمية الوجوه في مقاطع الفيديو، حيث تتكوّن المجموعة من الوجوه في إطار معين، وتُعلّم بقائمة من الأسماء الواردة في الوصف المرافق. في هذه الورقة، نقترح شبكة تلافيفية رسمية (GCN) جديدة تُسمّى مُشفّر الرسم البياني الثنائي المزدوج (DB-GAE) لمعالجة تحدي التباين في العلامات في GPLL. أولاً، نستغل الترابطات بين المجموعات لتمثيل مجموعات الكائنات كرسوم بيانية ثنائية مزدوجة: داخل المجموعة وعبر المجموعات، حيث تكمل كل منهما الأخرى لحل غموض الربط. ثانيًا، نصمم مُشفّرًا تلافيفيًا رسمياً لترميز وفك ترميز هاتين الرسوم، حيث تُعتبر النتائج الناتجة عن الترميز المُعدّل هي النتائج المُحسّنة. من المهم الإشارة إلى أن DB-GAE تعمل بشكل ذاتي الإشراف (self-supervised) ومتعدّدة التحويل (transductive)، إذ تستخدم فقط إشرافًا على المستوى المجمّع دون حاجة إلى مرحلة تدريب منفصلة مسبقة. أظهرت تجارب واسعة على مجموعتي بيانات واقعيتين أن DB-GAE تتفوّق بشكل كبير على أفضل نموذج مقارن، بفارق مطلق قدره 0.159 في مؤشر F1 و24.8% في الدقة. ونقدّم أيضًا تحليلًا متعدد المستويات لدرجات التباين في العلامات.

التعلم الجزئي العام عبر المُشَرَّح التلقائي الرسومي الثنائي المزدوج | أحدث الأوراق البحثية | HyperAI