HyperAIHyperAI

Command Palette

Search for a command to run...

نموذج مُعتمد على LayoutLMv3 لتحسين استخراج العلاقات في الوثائق الغنية بصرياً

Wiam Adnan Joel Tang Yassine Bel Khayat Zouggari Seif Edinne Laatiri Laurent Lam Fabien Caspani

الملخص

فهم الوثائق هو مجال متطور في معالجة اللغات الطبيعية (NLP). وبشكل خاص، تعتبر الخصائص البصرية والمكانيّة ضرورية بالإضافة إلى النص الخام نفسه، ولذلك تم تطوير العديد من النماذج متعددة الوسائط في مجال فهم الوثائق البصرية (VDU). ومع ذلك، بينما يركز البحث بشكل أساسي على استخراج المعلومات الرئيسية (KIE)، لا يزال استخراج العلاقات (RE) بين الكيانات المحددة قليل الدراسة. على سبيل المثال، يعتبر RE حاسمًا لإعادة تجميع الكيانات أو الحصول على هيكل شامل للبيانات في وثيقة. في هذا البحث، نقدم نموذجًا تم تهييجه من LayoutLMv3 يمكنه تحقيق أو تفوق النتائج الحالية الرائدة في RE عند تطبيقه على الوثائق الغنية بصريًا (VRD) باستخدام مجموعتي بيانات FUNSD وCORD، دون الحاجة إلى أي تدريب مسبق محدد وبعدد أقل من المعلمات. كما نقدم دراسة تقليصية موسعة أجريت على مجموعة بيانات FUNSD، والتي تسلط الضوء على التأثير الكبير لبعض الخصائص واختيارات النمذجة على الأداء.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp