HyperAIHyperAI

Command Palette

Search for a command to run...

GMMSeg: نماذج التجزئة الشكلية التوليدية المستندة إلى مزيج الغاوسيان

Chen Liang Wenguan Wang Jiaxu Miao Yi Yang

الملخص

الحلول الشائعة لتصنيف التجزئة المعانيّة هي في جوهرها فئة تمييزية كثيفة لـ ( p(\text{الفئة} \mid \text{ميزة البكسل}) ). وعلى الرغم من بساطتها، فإن هذا النموذج السائد يتجاهل التوزيع الأساسي للبيانات ( p(\text{ميزة البكسل} \mid \text{الفئة}) )، ويعاني من صعوبة في التعرف على البيانات التي تقع خارج التوزيع المعروف. وبهدف التقدم فوق هذا النموذج، نقترح نموذجًا جديدًا يُسمى GMMSeg، وهو عائلة جديدة من نماذج التجزئة تعتمد على فئة توليدية كثيفة للتوزيع المشترك ( p(\text{ميزة البكسل}, \text{الفئة}) ). لكل فئة، يقوم GMMSeg ببناء نماذج مزيج الغاوسي (GMMs) باستخدام خوارزمية التوقع-التحديث (EM)، بهدف التقاط الكثافات الشرطية حسب الفئة. وفي الوقت نفسه، يتم تدريب التمثيل الكثيف العميق بطريقة تمييزية بشكل متكامل (end-to-end)، أي من خلال تعظيم ( p(\text{الفئة} \mid \text{ميزة البكسل}) ). هذا يمنح GMMSeg مزايا كل من النماذج التوليدية والتمييزية معًا. وباستخدام مجموعة متنوعة من هياكل التجزئة والبنية الأساسية (backbones)، يتفوق GMMSeg على النماذج التمييزية المماثلة على ثلاث مجموعات بيانات مغلقة. والأكثر إثارة للاهتمام أن GMMSeg يُظهر أداءً جيدًا حتى على مجموعات بيانات عالم مفتوح، دون أي تعديلات إضافية. نعتقد أن هذه الدراسة تقدم رؤى جوهرية في المجالات ذات الصلة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp