HyperAIHyperAI
منذ 15 أيام

GMMSeg: نماذج التجزئة الشكلية التوليدية المستندة إلى مزيج الغاوسيان

Chen Liang, Wenguan Wang, Jiaxu Miao, Yi Yang
GMMSeg: نماذج التجزئة الشكلية التوليدية المستندة إلى مزيج الغاوسيان
الملخص

الحلول الشائعة لتصنيف التجزئة المعانيّة هي في جوهرها فئة تمييزية كثيفة لـ ( p(\text{الفئة} \mid \text{ميزة البكسل}) ). وعلى الرغم من بساطتها، فإن هذا النموذج السائد يتجاهل التوزيع الأساسي للبيانات ( p(\text{ميزة البكسل} \mid \text{الفئة}) )، ويعاني من صعوبة في التعرف على البيانات التي تقع خارج التوزيع المعروف. وبهدف التقدم فوق هذا النموذج، نقترح نموذجًا جديدًا يُسمى GMMSeg، وهو عائلة جديدة من نماذج التجزئة تعتمد على فئة توليدية كثيفة للتوزيع المشترك ( p(\text{ميزة البكسل}, \text{الفئة}) ). لكل فئة، يقوم GMMSeg ببناء نماذج مزيج الغاوسي (GMMs) باستخدام خوارزمية التوقع-التحديث (EM)، بهدف التقاط الكثافات الشرطية حسب الفئة. وفي الوقت نفسه، يتم تدريب التمثيل الكثيف العميق بطريقة تمييزية بشكل متكامل (end-to-end)، أي من خلال تعظيم ( p(\text{الفئة} \mid \text{ميزة البكسل}) ). هذا يمنح GMMSeg مزايا كل من النماذج التوليدية والتمييزية معًا. وباستخدام مجموعة متنوعة من هياكل التجزئة والبنية الأساسية (backbones)، يتفوق GMMSeg على النماذج التمييزية المماثلة على ثلاث مجموعات بيانات مغلقة. والأكثر إثارة للاهتمام أن GMMSeg يُظهر أداءً جيدًا حتى على مجموعات بيانات عالم مفتوح، دون أي تعديلات إضافية. نعتقد أن هذه الدراسة تقدم رؤى جوهرية في المجالات ذات الصلة.

GMMSeg: نماذج التجزئة الشكلية التوليدية المستندة إلى مزيج الغاوسيان | أحدث الأوراق البحثية | HyperAI