HyperAIHyperAI

Command Palette

Search for a command to run...

DocTr: Document Transformer لاستخراج المعلومات المهيكلة في الوثائق

Haofu Liao Aruni RoyChowdhury Weijian Li Ankan Bansal Yuting Zhang Zhuowen Tu Ravi Kumar Satzoda R. Manmatha Vijay Mahadevan

الملخص

نقدم صياغة جديدة لاستخراج المعلومات المهيكلة (SIE) من الوثائق الغنية بصرياً. تهدف هذه الصياغة إلى معالجة قيود الصيغ الحالية القائمة على الترميز IOB أو الرسم البياني، والتي تعتمد بشكل مفرط على ترتيب النص الإدخالي الصحيح أو تواجه صعوبات في فك رموز رسم بياني معقد. بدلاً من ذلك، مستوحاة من الكاشفات القائمة على النقاط المرجعية في مجال الرؤية، نمثل الكيان ككلمة نقطة مرجعية وصندوق حدود، ونمثل ربط الكيانات كرابطة بين الكلمات النقاط المرجعية. هذا أكثر متانة فيما يتعلق بترتيب النص ويحافظ على رسم بياني مضغوط لربط الكيانات. تحفزنا هذه الصياغة على تقديم 1) محول وثيقة (DocTr) يهدف إلى اكتشاف وربط صناديق حدود الكيانات في الوثائق الغنية بصرياً، و2) استراتيجية تدريب أولي بسيطة تساعد في تعلم اكتشاف الكيانات في سياق اللغة. أظهرت التقييمات على ثلاثة مقاييس للمعلومات المهيكلة استخراجها فعالية الصياغة المقترحة، وأداء النهج العام أفضل من الحلول الحالية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
DocTr: Document Transformer لاستخراج المعلومات المهيكلة في الوثائق | مستندات | HyperAI