إلى الكشف عن الكائنات في الحالة الخام تحت ظروف متنوعة

تُعتبر الطرق الحالية للكشف عن الكائنات غالبًا ما تأخذ الإدخال بالصيغة sRGB، التي تم ضغطها من البيانات الخام (RAW) باستخدام وحدة معالجة الصور (ISP) المصممة أولًا للعرض البصري. ومع ذلك، قد يؤدي هذا الضغط إلى فقدان معلومات حيوية للكشف عن الكائنات، خاصة في ظروف إضاءة وطقس معقدة. نقدم مجموعة بيانات AODRaw، التي تضم 7,785 صورة خام عالية الدقة حقيقية، مع 135,601 مثيلًا مُعلَّمًا تغطي 62 فئة، وتم التقاطها في مجموعة واسعة من المشاهد الداخلية والخارجية تحت 9 ظروف مختلفة من الإضاءة والطقس. وباستخدام مجموعة AODRaw التي تدعم الكشف عن الكائنات بالصيغة الخام (RAW) والصيغة sRGB، نقدم معيارًا شاملاً لتقييم الطرق الحالية للكشف عن الكائنات. وجدنا أن التدريب المسبق باستخدام sRGB يُقيّد الإمكانات الحقيقية للكشف عن الكائنات في الصيغة الخام (RAW) بسبب الفجوة بين المجالين (sRGB وRAW)، مما دفعنا إلى التدريب المسبق مباشرة على المجال الخام (RAW). ومع ذلك، يُعد التدريب المسبق على الصيغة الخام (RAW) أصعب من التدريب المسبق على sRGB بسبب الضوضاء الناتجة عن الكاميرا. ولمساندة التدريب المسبق على RAW، نقوم بتفريغ المعرفة من نموذج جاهز تم تدريبه مسبقًا على المجال sRGB. وبذلك، نحقق تحسينات كبيرة في ظروف متنوعة وصعبة دون الاعتماد على وحدات معالجة إضافية. يمكن الوصول إلى الشفرة والبيانات من خلال الرابط: https://github.com/lzyhha/AODRaw.