HyperAIHyperAI

Command Palette

Search for a command to run...

Console

PaddleOCR-VL: تحليل المستندات متعدد الوسائط

1. مقدمة البرنامج التعليمي

مستودع

PaddleOCR-VL هو نموذج متطور (SOTA) وفعّال في استخدام الموارد، مُصمم خصيصًا لمهام تحليل المستندات. مكونه الأساسي هو PaddleOCR-VL-0.9B، وهو نموذج لغة بصرية (VLM) مدمج وقوي، يدمج مُشفّرًا بصريًا بدقة ديناميكية على غرار NaViT مع نموذج اللغة ERNIE-4.5-0.3B، مما يُتيح التعرّف الدقيق على العناصر. يدعم هذا النموذج المبتكر 109 لغات بكفاءة، ويتميز بالتعرّف على العناصر المعقدة مثل النصوص والجداول والصيغ والرسوم البيانية، مع الحفاظ على استهلاك منخفض للغاية للموارد. من خلال تقييم شامل للمعايير العامة والداخلية المُستخدمة على نطاق واسع، يُحقق PaddleOCR-VL أداءً عاليًا في تحليل المستندات على مستوى الصفحة ومهام التعرّف على مستوى العناصر. يتفوق هذا النموذج بشكل ملحوظ على الحلول الحالية، ويُظهر قدرة تنافسية قوية مع نماذج اللغة البصرية عالية المستوى، ويوفر سرعات استنتاج عالية. هذه المزايا تجعله مناسبًا جدًا للتطبيق العملي. نتائج البحث ذات الصلة متاحة على [رابط البحث].PaddleOCR-VL: تعزيز تحليل المستندات متعددة اللغات عبر نموذج بصري لغوي فائق الصغر بحجم 0.9B".

يستخدم هذا البرنامج التعليمي بطاقة رسوميات RTX 5090 واحدة كمورد حوسبة.

2. أمثلة على التأثيرات

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.

كيفية الاستخدام 

 

معلومات الاستشهاد

@misc{cui2025paddleocrvlboostingmultilingualdocument,
      title={PaddleOCR-VL: Boosting Multilingual Document Parsing via a 0.9B Ultra-Compact Vision-Language Model}, 
      author={Cheng Cui and Ting Sun and Suyin Liang and Tingquan Gao and Zelun Zhang and Jiaxuan Liu and Xueqing Wang and Changda Zhou and Hongen Liu and Manhui Lin and Yue Zhang and Yubo Zhang and Handong Zheng and Jing Zhang and Jun Zhang and Yi Liu and Dianhai Yu and Yanjun Ma},
      year={2025},
      eprint={2510.14528},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2510.14528}, 
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp