HyperAIHyperAI

Command Palette

Search for a command to run...

شاندرا: تقنية التعرف الضوئي على الأحرف عالية الدقة للوثائق

Date

منذ 6 أيام

Size

5.19 MB

License

Apache 2.0

1. مقدمة البرنامج التعليمي

يبني
رخصة النموذج: OpenRAIL

شاندرا هو نظام عالي الدقة للتعرف الضوئي على الأحرف (OCR) للمستندات، طوّره فريق داتالاب-تو في أكتوبر 2025، ويركز على فهم تخطيط المستند واستخراج النصوص. يستطيع شاندرا معالجة ملفات PDF والصور مباشرةً، وإنشاء نصوص منظمة، ونصوص Markdown، ونصوص HTML، مع توفير مخططات تخطيط مرئية لتسهيل فحص نتائج التعرف الضوئي على الأحرف.

الميزات الأساسية:

  • التعرف الضوئي على الأحرف عالي الدقةمُحسَّن للمستندات والجداول والتخطيطات متعددة الأعمدة، ويدعم تخطيطات الصفحات المعقدة.
  • الوعي بالتصميميقوم بإنشاء مخططات تخطيط مرئية، مع تحديد كتل النصوص والجداول ومساحات الصور.
  • إخراج متعدد التنسيقاتيدعم تنزيل ملفات Markdown و HTML والنصوص العادية.
  • نشر سهلوبفضل واجهة Streamlit، فإنه يسمح بالتفاعل السريع في المتصفح.
  • نموذج خفيف الوزنيمكنك تحميل النموذج مباشرة باستخدام Transformers دون الحاجة إلى إضافة تبعية على vLLM.

يستخدم هذا البرنامج التعليمي Streamlit لنشر نموذج Chandra OCR الأساسي، مع موارد الحوسبة "RTX_5090"، مما يتيح استنتاج المستندات السريع وتصور التخطيط.

2. عرض التأثير

أدى تشاندرا أداءً استثنائياً في المهمة الأساسية:

  • التعرف الضوئي على الأحرف (OCR) لمستند من صفحة واحدةإنشاء نصوص عالية الدقة و Markdown من ملفات PDF أو الصور.
  • اكتشاف التخطيطيحدد بدقة مناطق مثل كتل النصوص والجداول والصور، ويدعم تصور التخطيط.
  • دعم المستندات متعددة الصفحاتيمكنه معالجة ملفات PDF على شكل صفحات، مع ترقيم الصفحات بدءًا من 1 لمنع حدوث أخطاء خارج النطاق.
  • مخرجات Markdown و HTMLيقوم بتضمين نتائج التعرف الضوئي على الأحرف (OCR) تلقائيًا في Markdown أو HTML، ويدعم التنزيل.
  • مخطط التخطيط المرئيقم بإنشاء صور PIL لمناطق النص المشروحة لتسهيل التحقق من دقة التعرف الضوئي على الأحرف (OCR).

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية أو قم بتشغيلها محليًا.

بعد تشغيل الحاوية، انقر فوق عنوان واجهة برمجة التطبيقات للوصول إلى واجهة الويب:

2. دليل المستخدم

إذا ظهرت رسالة "Bad Gateway"، فهذا يعني أن النموذج قيد التهيئة. يُرجى الانتظار من دقيقة إلى دقيقتين ثم تحديث الصفحة.

تَلمِيحإذا ظهرت عبارة "جارٍ تحميل النموذج"، فهذا يعني أن النموذج قيد التهيئة. يُرجى الانتظار من دقيقة إلى دقيقتين ثم تحديث الصفحة.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شاندرا: تقنية التعرف الضوئي على الأحرف عالية الدقة للوثائق | Notebooks | HyperAI