HyperAIHyperAI
منذ 17 أيام

تقسيم الأشياء الشفافة في البيئة الطبيعية

Enze Xie, Wenjia Wang, Wenhai Wang, Mingyu Ding, Chunhua Shen, Ping Luo
تقسيم الأشياء الشفافة في البيئة الطبيعية
الملخص

تتواجد الأشياء الشفافة مثل النوافذ والزجاجات المصنوعة من الزجاج بشكل واسع في العالم الحقيقي. ويعتبر فصل الأشياء الشفافة تحديًا كبيرًا نظرًا لتنوع مظهرها الناتج عن خلفيات الصور، مما يجعلها تشبه محيطها من حيث المظهر. علاوةً على الصعوبات التقنية المرتبطة بهذه المهمة، فإن عدد قليل جدًا من المجموعات السابقة تم تصميمها وجمعها خصيصًا لاستكشاف هذه المهمة، بينما تعاني معظم المجموعات الحالية من عيوب جوهرية. فبعضها يملك حجمًا عينيًا محدودًا، مثل ما يقارب ألف صورة دون تسميات يدوية، أو يتم إنشاء جميع الصور باستخدام طرق الرسوم الحاسوبية (أي أنها ليست صورًا حقيقية). ولحل هذه المشكلة الهامة، نقترح في هذه الدراسة مجموعة بيانات كبيرة الحجم لفصل الأشياء الشفافة، تُسمى Trans10K، وتتألف من 10,428 صورة من سيناريوهات حقيقية مع تسميات يدوية دقيقة، وهي أكبر بعشر مرات من المجموعات الحالية. وتشكل الأشياء الشفافة في Trans10K تحديًا كبيرًا جدًا نظرًا لتنوعها الكبير في الحجم والزاوية المرئية والتشويش (الإخفاء)، كما هو موضح في الشكل 1. ولتقييم فعالية Trans10K، نقترح طريقة جديدة للفصل تعتمد على الحدود، تُسمى TransLab، والتي تستغل الحدود كمؤشر لتحسين دقة فصل الأشياء الشفافة. وتشير التجارب الواسعة والدراسات التحليلية إلى فعالية Trans10K، وتحقق من الجدوى العملية لتعلم حدود الكائنات في TransLab. فعلى سبيل المثال، تتفوق TransLab بشكل كبير على 20 طريقة حديثة لفصل الكائنات تعتمد على التعلم العميق، مما يدل على أن هذه المهمة ما زالت غير مُحَلَّة بشكل كافٍ. ونعتقد أن كلًا من Trans10K وTransLab يسهمان بشكل مهم في الأوساط الأكاديمية والصناعية، ويسهّلان الأبحاث والتطبيقات المستقبلية.