إعادة التفكير في توليد ونمذجة الضوضاء في عملية تنقية البيانات الخام

يُشكل انعدام وجود مجموعة بيانات واسعة النطاق للصور الخام الحقيقية الخالية من الضوضاء تحديًا في توليد ضوضاء صور خام واقعية لتدريب نماذج إزالة الضوضاء. ومع ذلك، فإن الضوضاء الحقيقية في الصور الخام تنتج عن العديد من مصادر الضوضاء وتختلف بشكل كبير بين المستشعرات المختلفة. ولا تتمكن الطرق الحالية من نمذجة جميع مصادر الضوضاء بدقة، كما أن بناء نموذج ضوضاء لكل مستشعر يُعد عملًا مُتعبًا. في هذه الورقة، نقدم منظورًا جديدًا لتوليد الضوضاء من خلال أخذ عينات مباشرة من ضوضاء المستشعر الحقيقية. ويُولِّد هذا النهج بشكل طبيعي ضوضاء صور خام دقيقة لمستشعرات كاميرات مختلفة. كما نُقدِّم طريقتين فعّالتين وشاملتين: أخذ العينات المُحاذاة للنمط (pattern-aligned patch sampling) وإعادة البناء عالي البت (high-bit reconstruction)، اللتان تُسهمان على التوالي في توليد ضوضاء مرتبطة مكانيًا وضوضاء عالية البت بدقة. قمنا بإجراء تجارب منهجية على مجموعتي بيانات SIDD وELD. وأظهرت النتائج ما يلي: (1) يتفوّق طريقة我们的 على الطرق الحالية ويُظهر تعميمًا واسعًا على مستشعرات مختلفة وظروف إضاءة متنوعة. (2) إن الاستنتاجات الحديثة المستمدة من طرق النمذجة القائمة على الشبكات العصبية العميقة (DNN) تعتمد في الواقع على معلمات ضوضاء غير دقيقة، ولا تزال الطرق القائمة على الشبكات العصبية العميقة غير قادرة على التفوق على الطرق الإحصائية القائمة على الفيزياء.