Command Palette
Search for a command to run...
من خلال اختراق الاعتماد على المستندات المنظمة، يحقق dots.ocr أداء OCR متطورًا للغاية في مئات اللغات استنادًا إلى 1.7 مليار معلمة.

في الآونة الأخيرة، أحدث نموذج يسمى dots.ocr ضجة في مجال تقنية التعرف الضوئي على الحروف (OCR) بتصميمه الخفيف الفريد وقدراته الدقيقة على استخراج النصوص. dots.ocr هو نموذج تحليل تخطيط المستندات متعدد اللغات الذي أصدره مختبر Xiaohongshu hi في أغسطس 2025.يعتمد النموذج على نموذج لغة بصرية (VLM) يحتوي على 1.7 مليار معلمة يمكنه إجراء اكتشاف التخطيط والتعرف على المحتوى بطريقة موحدة.سواء كان الأمر يتعلق بمسح ضوئي غير واضح أو لقطة شاشة مائلة من هاتف محمول أو لقطة شاشة منخفضة الدقة، يمكن لـ dots.ocr التقاط معلومات نصية مجزأة بدقة من خلال خوارزميات تقليل الضوضاء التكيفية وتقنية التجزئة الديناميكية.يتيح التصميم الدقيق بحجم نموذج أقل من 2B للمعدات الصناعية والمحطات المتنقلة وحتى الأنظمة المضمنة تحقيق التعرف على النصوص في الوقت الفعلي على مستوى ميلي ثانية، والانفصال تمامًا عن الاعتماد على السحابة..
الأهم من ذلك، أن dots.ocr يكسر اعتماد تقنيات التعرف الضوئي على الحروف التقليدية على المستندات المنظمة. فمن خلال دمج آلية دمج الميزات متعددة المقاييس مع تصحيح الأخطاء الدلالية السياقية، يحافظ النموذج على اتساق ودقة تضاهي دقة القراءة البشرية عند التعرف على الكتابة اليدوية غير الدقيقة، أو البيانات الجدولية الكثيفة، أو النصوص المطبعية المختلطة. بالإضافة إلى ذلك،فيما يتعلق بمعالجة المستندات متعددة اللغات، فهو يدعم 100 لغة بما في ذلك الصينية والإنجليزية، ويمكنه التعرف بدقة على محتوى النص وعناصر التخطيط في المستندات متعددة اللغات ومعالجتها.سواءً كنت تتعامل مع مستندات متعددة اللغات أو بيئات لغوية معقدة، يُقدم dots.ocr نتائج تحليل دقيقة ومستقرة. في معايير مثل OmniDocBench، يُنافس أداء dots.ocr في التعرف على الصيغ أداء نماذج أكبر مثل Doubao-1.5 وGemini2.5-Pro. ويُظهر أداءً ملحوظًا في تحليل لغات الأقليات، مُحققًا بذلك هدف "الدقة والصغر".
في الوقت الحالي،dots.ocr: نموذج تحليل مستندات متعدد اللغاتتم تحميله إلى قسم "الدليل التعليمي" على الموقع الرسمي لـ HyperAI. انقر على الرابط أدناه لنشره بنقرة واحدة.
رابط البرنامج التعليمي:
تشغيل تجريبي
1. في الصفحة الرئيسية لـ hyper.ai، حدد صفحة البرامج التعليمية، واختر dots.ocr: نموذج تحليل المستندات متعدد اللغات، وانقر فوق تشغيل هذا البرنامج التعليمي عبر الإنترنت.


2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

٣. اختر صورتي "NVIDIA GeForce RTX 4090" و"PyTorch"، ثم اختر "الدفع الفوري" أو "الباقة اليومية/الأسبوعية/الشهرية" حسب احتياجاتك، ثم انقر على "متابعة". يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على ٤ ساعات من بطاقة RTX 4090 + ٥ ساعات من وقت فراغ المعالج!
رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):
https://openbayes.com/console/signup?r=Ada0322_NR0n


٤. انتظر حتى يتم تخصيص الموارد. تستغرق عملية الاستنساخ الأولى حوالي ٣ دقائق. عندما تتغير الحالة إلى "قيد التشغيل"، انقر على السهم بجوار "عنوان واجهة برمجة التطبيقات" للانتقال إلى صفحة العرض التوضيحي. يُرجى العلم أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام عنوان واجهة برمجة التطبيقات.


عرض التأثير
باستخدام وظيفة "التحليل" كمثال، قمت بتحميل مستند باللغة الإنجليزية، وكان التأثير كما يلي:

سواء كان جدولاً أو صيغة، يمكن للنموذج القيام بعمل ممتاز في التعرف على:


ما سبق هو البرنامج التعليمي الذي توصي به HyperAI هذه المرة. الجميع مدعوون للحضور وتجربته!
رابط البرنامج التعليمي:https://go.hyper.ai/49mZU
احصل على أوراق بحثية عالية الجودة ومقالات تفسيرية متعمقة في مجال AI4S من عام 2023 إلى عام 2024 بنقرة واحدة⬇️
