HyperAIHyperAI

Command Palette

Search for a command to run...

وحدة U-Net متعددة الطبقات ذات تفرع مُنظَّمَة للإزالة التصحيحية للصور الوثائقية

Hmrishav Bandyopadhyay Tanmoy Dasgupta Nibaran Das Mita Nasipuri

الملخص

إن التقاط صور الوثائق يُعد إحدى أسهل الطرق وأكثرها استخدامًا لتوثيقها. ومع ذلك، فإن هذه الصور، التي تُلتقط باستخدام أجهزة محمولة، غالبًا ما تتعرض تشوهات غير مرغوب فيها يصعب إزالتها. نقترح في هذا العمل وحدة مُحكمة مُتعددة الطبقات من نوع U-Net ذات فرعين وشفرة تحكمية (Gated and Bifurcated Stacked U-Net) مُدرَّبة بأسلوب مراقب لتنبؤ شبكة تصحيح التشوهات (dewarping grid) وإنتاج صورة خالية من التشوهات من الصورة المدخلة. وعلى الرغم من أن الشبكة تم تدريبها على صور وثائق مُشوهَة اصطناعيًا، فإن النتائج تُقيَّم بناءً على صور واقعية من العالم الحقيقي. تكمن الابتكار في طريقتنا ليس فقط في تقسيم شبكة U-Net لمنع التداخل بين إحداثيات الشبكة، بل أيضًا في استخدام شبكة مُحكَمة (Gated Network) التي تُضفي تفاصيل دقيقة على الحدود والخطوط الدقيقة إلى النموذج. ويُحقق النموذج المُقترح ببنية متكاملة من البداية إلى النهاية (end-to-end) أداءً متفوقًا على مستوى الحالة الحالية (state-of-the-art) على مجموعة بيانات DocUNet، بعد تدريبه على مجرد 8% من كمية البيانات المستخدمة في الطرق السابقة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
وحدة U-Net متعددة الطبقات ذات تفرع مُنظَّمَة للإزالة التصحيحية للصور الوثائقية | مستندات | HyperAI