DiffusionInst: نموذج التشتت للتقسيم الحديدي

أظهرت أطر العمل التفريقيّة أداءً مماثلاً للأفضل في نماذج توليد الصور السابقة. يثير اهتمام الباحثين تنويعاتها في المهام التمييزية نظرًا لقوّة خط أنابيب إزالة الضوضاء من الضوضاء إلى الصورة. تقدم هذه الورقة إطار عمل جديد يُدعى DiffusionInst، حيث يُمثّل الكيانات كمرشحات واعية بالكيان، ويُصاغ تصنيف الكيانات كعملية إزالة ضوضاء من مرشح إلى مرشح نقي. يتم تدريب النموذج على عكس التصحيح المضطرب دون أي انحياز استنتاجي من RPN. أثناء الاستدلال، يأخذ نموذج دخولًا مكوّنًا من مرشح عشوائي ويُخرِج قناعًا في خطوة واحدة أو خطوات متعددة لإزالة الضوضاء. أظهرت النتائج التجريبية الواسعة على مجموعتي بيانات COCO وLVIS أداءً تنافسيًا مقارنةً بالنماذج الحالية لتصنيف الكيانات، باستخدام هياكل أساسية متنوعة مثل ResNet وSwin Transformers. نأمل أن تُسهم أبحاثنا في كونها أساسًا قويًا، مما يُحفّز على تصميم أطر تفريقيّة أكثر كفاءة للمهام التمييزية الصعبة. يمكن الوصول إلى الكود الخاص بنا عبر الرابط: https://github.com/chenhaoxing/DiffusionInst.