برنامج تعليمي عبر الإنترنت | هل يعمل على بطاقات الرسومات الاستهلاكية؟ طراز OCRFlux-3B خفيف الوزن يُحقق لأول مرة ميزة التعرف الذكي على النصوص المعقدة.

عند تحويل ملفات PDF، لم يعد عليك أن تقلق بشأن الصيغ والجداول والنصوص المتداخلة بين الصفحات والتي قد تعطل التخطيط!
دعم تحليل المستندات الدفعية، واستخراج المعلومات المنظمة، والتوافق مع دمج المحتوى عبر الصفحات... أصدر فريق ChatDOC برنامج OCRFlux-3B، وهو عبارة عن مجموعة أدوات تعتمد على نموذج لغوي واسع النطاق ومتعدد الوسائط، والذي يمكنه تحويل ملفات PDF والصور إلى تنسيق Markdown نظيف وقابل للقراءة ونص عادي.
يوفر OCRFlux-3B إمكانيات تحويل النص على مستوى الصفحة، والتي يمكنها تحويل النص بدقة في ملفات PDF والصور إلى تنسيق Markdown.لا تستطيع هذه الأداة التعامل مع الجداول المعقدة مثل العناوين المتكررة، أو الصفوف أو الأعمدة الممتدة، أو الترقيم الأفقي، أو الهياكل المتداخلة فحسب، بل تستطيع أيضًا التعرف على الصيغ المعقدة في الأوراق ودعم دمج الجداول والفقرات عبر الصفحات.حتى في التصميمات المعقدة متعددة الأعمدة والرسومات والمُلحقات، يبقى ترتيب قراءة النص طبيعيًا. بعد تحويل ملفات PDF إلى نص Markdown قابل للتحرير والبحث، يمكن للباحثين استخراج الجداول والصيغ بسرعة من مستندات PDF.حاليًا، يعد OCRFlux-3B أول نموذج في مشاريع OCR مفتوحة المصدر لتحقيق هذه القدرة.
OCRFlux-3B هو نموذج خفيف الوزن تم ضبطه بدقة استنادًا إلى نموذج اللغة البصرية المتعددة الوسائط Qwen2.5-VL-3B-Instruct، لذلك يمكن تشغيله أيضًا على بطاقات الرسوميات المخصصة للمستهلك (مثل GTX 3090).
في الوقت الحالي،OCRFlux-3B: مجموعة أدوات التعرف على النصوص الذكيةقسم الدروس التعليمية على الموقع الرسمي لـ HyperAI (hyper.ai) متاح الآن. بنقرة واحدة، يمكنك تجربة تحويل مستندات PDF والصور وملفات متعددة إلى نصوص Markdown قابلة للبحث عبر الإنترنت. انضم إلينا!
رابط البرنامج التعليمي:
رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):
https://openbayes.com/console/signup?r=Ada0322_NR0n
تشغيل تجريبي
1. في الصفحة الرئيسية لـ hyper.ai، حدد صفحة البرامج التعليمية، واختر OCRFlux-3B: Intelligent Text Recognition Toolkit، ثم انقر فوق تشغيل هذا البرنامج التعليمي عبر الإنترنت.


2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

٣. اختر "NVIDIA GeForce RTX 4090". توفر منصة OpenBayes أربعة خيارات للدفع: "الدفع الفوري" أو "يومي/أسبوعي/شهري" حسب احتياجاتك. بعد اختيار صورة "PyTorch"، انقر على "متابعة". يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على ٤ ساعات مجانية من بطاقة RTX 4090 و٥ ساعات مجانية من استخدام المعالج!
رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):
https://openbayes.com/console/signup?r=Ada0322_NR0n


4. انتظر حتى يتم تخصيص الموارد. تستغرق عملية الاستنساخ الأولى حوالي دقيقتين. عندما تتغير الحالة إلى "قيد التشغيل"، انقر فوق سهم الانتقال بجوار "عنوان API" للانتقال إلى صفحة العرض التوضيحي. يرجى ملاحظة أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان API.

عرض التأثير
انقر على عنوان واجهة برمجة التطبيقات (API) للدخول إلى صفحة العرض التوضيحي لتجربة النموذج. بعد الوصول إلى صفحة النموذج، حمّل ملف PDF أو صورة أو ملفات متعددة، ثم انقر على "معالجة" لإنشاء نص Markdown المقابل. النتيجة كالتالي:

يمكن لبرنامج OCRFlux-3B أيضًا التعرف بسهولة على الجداول والصيغ المتناثرة في الورقة:




هذا هو البرنامج التعليمي المُوصى به لهذه المشكلة. نرحب بالجميع لتجربته بأنفسكم⬇️
رابط البرنامج التعليمي: