HyperAIHyperAI

Command Palette

Search for a command to run...

LiLT: محول تخطيط بسيط ومعتمد للغة لفهم الوثائق الهيكلية

Jiapeng Wang extsuperscript1 Lianwen Jin extsuperscript*1,3,4 Kai Ding extsuperscript2,3

الملخص

فهم الوثائق المهيكلة قد جذب اهتمامًا كبيرًا وحقق تقدمًا ملحوظًا مؤخرًا، بفضل دوره الحاسم في معالجة الوثائق الذكية. ومع ذلك، فإن معظم النماذج ذات الصلة الموجودة حاليًا يمكنها التعامل فقط مع بيانات الوثائق بلغة محددة (غالبًا الإنجليزية) التي تضمنها مجموعة التدريب الأولي، مما يعتبر قاصرًا بشكل كبير. لمعالجة هذه المشكلة، نقترح نموذج تحويلة التخطيط المستقلة عن اللغة (Language-independent Layout Transformer - LiLT) البسيط والفعال لفهم الوثائق المهيكلة. يمكن تدريب LiLT بشكل أولي على الوثائق المهيكلة بلغة واحدة ومن ثم ضبطه بدقة مباشرة على لغات أخرى باستخدام النماذج النصية أحادية اللغة/متعددة اللغات الجاهزة المقابلة. أظهرت نتائج التجارب على ثماني لغات أن LiLT يمكن أن يحقق أداءً تنافسيًا أو حتى أفضل على مجموعة متنوعة من مقاييس الأداء المستخدمة على نطاق واسع في المهام اللاحقة للتدريب، مما يمكّن من الاستفادة المستقلة عن اللغة من التدريب الأولي لهيكل التخطيط للوثيقة. الرمز والنماذج متاحة بشكل عام على الرابط: https://github.com/jpWang/LiLT.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp