HyperAI

ما وراء التعرف الضوئي على الحروف التقليدي! نشر بنقرة واحدة لأحدث إنجازات Google InkSight: التعرف الدقيق على النص المكتوب بخط اليد، دون الضغط على اللغتين الصينية والإنجليزية

特色图像

في الماضي، كان الدرس الأول الذي يتعلمه الناس عند دخول المدرسة هو وضعية حمل القلم الصحيحة، ثم يبدأون في تعلم الكتابة من الأرقام العربية الأساسية والبينيين الصيني، ثم يتقدمون تدريجيا إلى الأحرف الصينية واللغة الإنجليزية. في كثير من الأحيان، يرتبط أسلوب الكتابة لدى الشخص ارتباطًا وثيقًا بسمات شخصيته، من القوي والقوي إلى الجريء وغير المقيد، ومن الجميل والأنيق إلى الهادئ والمسالم...

في الوقت الحاضر، حلت السجلات الإلكترونية المعتمدة على أجهزة الكمبيوتر والهواتف المحمولة والأجهزة اللوحية محل الكتابة اليدوية بسرعة في العديد من السيناريوهات، كما يتقدم "التخلي عن الورق" بشكل مطرد في ظل الاتجاه العام لحماية البيئة والحد من الكربون. ومع ذلك، لا يزال النص المكتوب بخط اليد نشطًا في حياة الناس اليومية، مثل ملاحظات الدراسة والإلهام والإبداع المرتجل، وما إلى ذلك. وفي الوقت نفسه، يتم نسخ الوثائق القديمة في الغالب يدويًا، ويساعد تحويلها إلى تنسيق إلكتروني على تخزينها على المدى الطويل أو استرجاعها الفوري.

ولتحقيق هذه الغاية، يعد التعرف الدقيق على النص المكتوب بخط اليد أمرا بالغ الأهمية.غالبًا ما يكون أداء تقنية التعرف الضوئي على الحروف (OCR) التقليدية ضعيفًا عند مواجهة خلفيات مزدحمة أو خط يد غير واضح، مما يؤدي إلى انخفاض كبير في دقة التعرف.

أصدرت شركة Google Research مؤخرًا إنجازًا جديدًا، وهو InkSight، والذي يختلف عن OCR، والذي يقوم ببساطة بنسخ الكتابة اليدوية إلى مستندات نصية.يمكن لـ InkSight التقاط مجموعة ضربات المستندات المكتوبة بخط اليد وتحقيق التعرف على النص المكتوب بخط اليد بطريقة أكثر طبيعية.

على وجه التحديد، اقترح الباحثون طريقة عرض يمكنها التقاط صور للنصوص المكتوبة بخط اليد واستخراج الخطوط المكتوبة، مع التخلص أيضًا من الاعتماد على الهياكل الهندسية النموذجية (أي استخدام التدرجات والخطوط والأشكال في الصور لاستخراج الخطوط المكتوبة).نموذج التدريب يقلد البشر لفهم "القراءة" و"الكتابة"،يمكن للأول التعرف على النص المكتوب، في حين يمكن للأخير إخراج ضربات تشبه خط اليد وتجميع الفهم لمظهر النص ومعناه من خلال إعادة الكتابة المستمرة وتعلم النص المكتوب بخط اليد.

الآن،أطلق قسم البرامج التعليمية في الموقع الرسمي لشركة HyperAI "عرض توضيحي لـ InkSight لتحويل النصوص المكتوبة بخط اليد إلى صيغة رقمية".استنساخ بنقرة واحدة لتجربته عبر الإنترنت! تعال وقم بتحويل "كنز الحبر" الخاص بك إلى تنسيق إلكتروني ~

رابط البرنامج التعليمي:

https://go.hyper.ai/DR89z

تشغيل تجريبي

1. قم بتسجيل الدخول إلى hyper.ai، في صفحة البرامج التعليمية، حدد InkSight Digitize Handwritten Text Demo، ثم انقر فوق تشغيل هذا البرنامج التعليمي عبر الإنترنت.

2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

3. انقر فوق "التالي: حدد معدل التجزئة" في الزاوية اليمنى السفلية.

4. بعد الانتقال إلى الصفحة التالية، حدد "NVIDIA GeForce RTX 4090" وصورة "PyTorch"، ثم حدد "الدفع حسب الاستخدام" أو "الحزمة اليومية/الأسبوعية/الشهرية" وفقًا لاحتياجاتك، ثم انقر فوق "التالي: المراجعة". يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على 4 ساعات من RTX 4090 + 5 ساعات من وقت فراغ وحدة المعالجة المركزية!

رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح): 

https://openbayes.com/console/signup?r=Ada0322_QZy7

5. بعد التأكيد، انقر فوق "متابعة" وانتظر حتى يتم تخصيص الموارد. ستستغرق عملية الاستنساخ الأولى حوالي 3 دقائق. عندما تتغير الحالة إلى "قيد التشغيل"، انقر فوق سهم الانتقال بجوار "عنوان API" للانتقال إلى صفحة العرض التوضيحي.يرجى ملاحظة أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان API.

نظرًا لأن النموذج كبير جدًا، فبعد أن يُظهر الحاوية أنه قيد التشغيل، يتعين عليك الانتظار لمدة دقيقة تقريبًا قبل فتح عنوان API، وإلا فسيتم عرض BadGateway.

عرض التأثير

بعد فتح واجهة العرض التوضيحي،ينقسم البرنامج التعليمي إلى وضعين: "الاستدلال على مستوى الكلمة" و"الاستدلال على الصفحة الكاملة".ملاحظة: لا ينطبق نسخ الكلمات إلا على التعرف على الأحرف أو الكلمات المفردة.

لقد جعلت من نفسي أضحوكة عندما كتبت بخط يدي عبارة "أتمنى أن يسير كل شيء على ما يرام" وسطرًا كلاسيكيًا من فيلم "فورست غامب". تم التعرف على اللغتين الصينية والإنجليزية بدقة!

نسخ الكلمات
نص "فورست غامب" باللغة الإنجليزية

لقد قمنا بتأسيس "مجموعة تبادل الدروس حول الانتشار المستقر". نرحب بالأصدقاء للانضمام إلى المجموعة لمناقشة القضايا الفنية المختلفة ومشاركة نتائج التطبيق ~

قم بمسح رمز الاستجابة السريعة أدناه لإضافة HyperaiXingXing على WeChat (معرف WeChat: Hyperai01)، ولاحظ "SD Tutorial Exchange Group" للانضمام إلى الدردشة الجماعية.