HyperAIHyperAI
منذ 17 أيام

وحدة U-Net متعددة الطبقات ذات تفرع مُنظَّمَة للإزالة التصحيحية للصور الوثائقية

Hmrishav Bandyopadhyay, Tanmoy Dasgupta, Nibaran Das, Mita Nasipuri
وحدة U-Net متعددة الطبقات ذات تفرع مُنظَّمَة للإزالة التصحيحية للصور الوثائقية
الملخص

إن التقاط صور الوثائق يُعد إحدى أسهل الطرق وأكثرها استخدامًا لتوثيقها. ومع ذلك، فإن هذه الصور، التي تُلتقط باستخدام أجهزة محمولة، غالبًا ما تتعرض تشوهات غير مرغوب فيها يصعب إزالتها. نقترح في هذا العمل وحدة مُحكمة مُتعددة الطبقات من نوع U-Net ذات فرعين وشفرة تحكمية (Gated and Bifurcated Stacked U-Net) مُدرَّبة بأسلوب مراقب لتنبؤ شبكة تصحيح التشوهات (dewarping grid) وإنتاج صورة خالية من التشوهات من الصورة المدخلة. وعلى الرغم من أن الشبكة تم تدريبها على صور وثائق مُشوهَة اصطناعيًا، فإن النتائج تُقيَّم بناءً على صور واقعية من العالم الحقيقي. تكمن الابتكار في طريقتنا ليس فقط في تقسيم شبكة U-Net لمنع التداخل بين إحداثيات الشبكة، بل أيضًا في استخدام شبكة مُحكَمة (Gated Network) التي تُضفي تفاصيل دقيقة على الحدود والخطوط الدقيقة إلى النموذج. ويُحقق النموذج المُقترح ببنية متكاملة من البداية إلى النهاية (end-to-end) أداءً متفوقًا على مستوى الحالة الحالية (state-of-the-art) على مجموعة بيانات DocUNet، بعد تدريبه على مجرد 8% من كمية البيانات المستخدمة في الطرق السابقة.