LLVIP: مجموعة بيانات مزدوجة مرئية وحمراء خارج الطيف للرؤية في الإضاءة المنخفضة

يعد تنفيذ مهام بصرية مختلفة مثل دمج الصور، وكشف الأشخاص، وترجمة الصورة إلى صورة أخرى في ظروف الإضاءة المنخفضة أمرًا صعبًا للغاية بسبب فقدان المناطق الفعالة للهدف. في هذه الحالة، يمكن استخدام الصور تحت الحمراء والصور المرئية معًا لتوفير كلاً من المعلومات التفصيلية الغنية والمناطق الفعالة للهدف. في هذا البحث، نقدم مجموعة بيانات LLVIP (منخفض الإضاءة مرئي تحت أحمر)، وهي مجموعة بيانات مزدوجة تجمع بين الصور المرئية والصور تحت الحمراء لرؤية منخفضة الإضاءة. تحتوي هذه المجموعة على 30976 صورة، أو 15488 زوجًا، معظمها تم التقاطها في مشاهد غامقة جدًا، وكل الصور مُحاذاة بدقة زمنيًا ومكانيًا. تم وضع علامات على الأشخاص في المجموعة البيانات. قارنا هذه المجموعة البيانات مع مجموعات بيانات مرئي-تحت أحمر أخرى وتقييم أداء بعض الخوارزميات البصرية الشائعة بما في ذلك دمج الصور، وكشف الأشخاص، وترجمة الصورة إلى صورة أخرى على هذه المجموعة البيانات. تظهر النتائج التجريبية تأثير التكامل التكميلي للمعلومات في الصور، كما تكشف عن نقص الخوارزميات الموجودة لأداء الثلاث مهام البصرية في ظروف الإضاءة المنخفضة جدًا. نعتقد أن مجموعة بيانات LLVIP ستساهم في مجتمع رؤية الكمبيوتر من خلال تعزيز دمج الصور وكشف الأشخاص وترجمة الصورة إلى صورة أخرى في التطبيقات ذات الإضاءة المنخفضة جدًا. يتم إصدار المجموعة البيانات على الرابط https://bupt-ai-cz.github.io/LLVIP. كما يُوفر أيضًا البيانات الخام لبحوث إضافية مثل تسجيل الصور.