تغلب على صعوبات التعرف على خط اليد OCR! تم إطلاق برنامج InkSight التعليمي، لتحقيق نسخ عالي الدقة؛ تم إصدار مجموعة بيانات iNatSounds، التي تحتوي على 230,000 صوتًا للأنواع الطبيعية

تعد الملاحظات المكتوبة بخط اليد هي الطريقة التي يسجل بها العديد من الأشخاص الإلهام في حياتهم اليومية، ولكن كيفية تحويل المحتوى المكتوب بخط اليد إلى نص إلكتروني بكفاءة كانت دائمًا تحديًا كبيرًا. غالبًا ما تكون دقة تقنية التعرف الضوئي على الحروف (OCR) التقليدية محدودة عند التعامل مع خلفيات معقدة أو خط يد غير منتظم.
ولحل هذه المشكلة، أطلقت جوجل للأبحاث مؤخرًا تقنية InkSight، التي تحاكي عملية القراءة البشرية من خلال التعلم العميق، وتتعرف بدقة على النص المكتوب بخط اليد وتستعيد أسلوبه تمامًا. على عكس تقنية التعرف الضوئي على الحروف التقليدية، لا يزال بإمكان InkSight الحفاظ على دقة عالية في الإضاءة المنخفضة أو الخلفيات المعقدة، ودعم النسخ على مستوى الكلمة والصفحة الكاملة، ويكون التأثير مماثلاً تقريبًا للكتابة اليدوية الأصلية. وقد أظهرت هذه التكنولوجيا إمكانات كبيرة في مجالات مثل رقمنة الوثائق وحماية التراث الثقافي.
من أجل مساعدة العديد من عشاق الكتابة اليدوية على رقمنة إبداعاتهم بسهولة وتسهيل النسخ عالي الدقة للوثائق الثمينة،أصبح البرنامج التعليمي الخاص بـ InkSight متاحًا الآن على الموقع الرسمي لـ hyper.ai. يمكنك تجربته عن طريق استنساخه بنقرة واحدة~
تشغيل عبر الإنترنت:https://go.hyper.ai/gVh8a

من 11 نوفمبر إلى 15 نوفمبر، تحديثات الموقع الرسمي لـ hyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 6
* اختيار المقالات المجتمعية: 4 مقالات
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات مع الموعد النهائي في نوفمبر: 2
قم بزيارة الموقع الرسمي: hyper.ai
مجموعات البيانات العامة المختارة
1. مجموعة بيانات القيادة الذاتية DrivingDojo
تحتوي مجموعة بيانات القيادة الذاتية DrivingDojo على حوالي 18 ألف مقطع فيديو، وهي مصممة خصيصًا لمحاكاة التفاعلات البصرية في العالم الحقيقي وتغطي إجراءات القيادة الغنية والتفاعلات بين العديد من الوكلاء ومعرفة القيادة في العالم المفتوح. تهدف مجموعة البيانات هذه إلى تعزيز تطوير النماذج التفاعلية والمستنيرة لعالم القيادة.
الاستخدام المباشر:https://go.hyper.ai/Y86yY

2. مجموعة بيانات صور الطرق السريعة الأمريكية TuSimple
تحتوي مجموعة بيانات TuSimple على 6,408 صورة للطرق السريعة في الولايات المتحدة، بما في ذلك 3,626 للتدريب، و358 للتحقق، و2,782 للاختبار. دقة الصورة هي 1280×720، وجميع الصور تم التقاطها في ظل ظروف جوية مختلفة.
الاستخدام المباشر:https://go.hyper.ai/Mo6bt

3. تصنيف الرياضة - مجموعة بيانات 100 صورة رياضية
تغطي مجموعة البيانات هذه مجموعة من صور الحركة لـ 100 رياضة مختلفة، وجميع الصور بتنسيق jpg 224x224x3. يتم تقسيم البيانات إلى صور تدريبية وصور اختبار وصور التحقق. بالإضافة إلى ذلك، تأتي مجموعة البيانات مع ملف CSV لتسهيل قيام الباحثين بتحميل بيانات الصور هذه ومعالجتها.
الاستخدام المباشر:https://go.hyper.ai/715At

4. أنواع النباتات المنزلية: مجموعة بيانات تضم 47 نوعًا من النباتات الداخلية
تم جمع مجموعة البيانات من Bing Images وتحتوي على 14,790 صورة مصنفة إلى 47 فئة مختلفة من أنواع النباتات.
الاستخدام المباشر:https://go.hyper.ai/v7wTX

5.مجموعة بيانات التنوع البيولوجي للحشرات متعددة الوسائط BIOSCAN-5M
BIOSCAN-5M هي مجموعة بيانات شاملة ومتعددة الوسائط للتنوع البيولوجي للحشرات مصممة لفهم ومراقبة التنوع البيولوجي العالمي للحشرات. تحتوي مجموعة البيانات على معلومات مفصلة عن أكثر من 5 ملايين عينة حشرية، مما يؤدي إلى توسيع مجموعات البيانات البيولوجية القائمة على الصور بشكل كبير.
الاستخدام المباشر:https://go.hyper.ai/YDeuN

6. مجموعة بيانات أصوات iNaturalist مجموعة بيانات أصوات الأنواع الطبيعية
مجموعة البيانات عبارة عن مجموعة من ملفات الصوت الخاصة بالأنواع الطبيعية، والتي تجمع 230 ألف ملف صوتي، تلتقط الأصوات من أكثر من 5.5 ألف نوع، ساهم بها أكثر من 27 ألف مسجل في جميع أنحاء العالم.
الاستخدام المباشر:https://go.hyper.ai/S0lg6

7. مجموعة بيانات الأقمار الصناعية عالية الدقة OpenSatMap
OpenSatMap عبارة عن مجموعة بيانات أقمار صناعية عالية الدقة مصممة لبناء خرائط واسعة النطاق. ويحتوي الكتاب على صور ليس فقط للعديد من المدن في الصين، بل أيضًا لأكثر من 50 مدينة و18 دولة حول العالم. تتمتع هذه الصور بدقة 20 مستوى، وهي الأعلى بين مجموعات بيانات الأقمار الصناعية الموجودة.
الاستخدام المباشر:https://go.hyper.ai/PtbCB

8. مجموعة بيانات صور البطاقات
صورة البطاقات هي مجموعة بيانات لصور بطاقات اللعب. تحتوي مجموعة البيانات على 7624 صورة تدريبية، و265 صورة اختبار، و265 صورة للتحقق. جميع الصور بصيغة jpg 224x224x3. تم اقتصاص كل صورة بعناية لإظهار بطاقة لعب واحدة فقط، وتحتل أكثر من 50% بكسل من الصورة.
الاستخدام المباشر:https://go.hyper.ai/DuOJb

9. مجموعة بيانات أزواج الصور والنصوص واسعة النطاق PD12M
PD12M هي أكبر مجموعة بيانات لأزواج الصور والنصوص في المجال العام، وتحتوي على 12.4 مليون صورة عالية الجودة مرخصة في المجال العام وCCO مع تعليقات توضيحية اصطناعية، تُستخدم بشكل أساسي لتدريب نماذج النص إلى صورة.
الاستخدام المباشر:https://go.hyper.ai/xyjrD

10. مجموعة بيانات MINT-1T النصية متعددة الوسائط للصور
مجموعة البيانات MINT-1T عبارة عن مجموعة بيانات متعددة الوسائط تحتوي على تريليون علامة نصية و3.4 مليار صورة، وهو ما يزيد بمقدار 10 أضعاف عن حجم أكبر مجموعة بيانات مفتوحة المصدر سابقة. لا تشتمل مجموعة البيانات على مستندات HTML فحسب، بل تشتمل أيضًا على مستندات PDF وأوراق ArXiv، مما يحسن بشكل كبير تغطية المستندات العلمية.
الاستخدام المباشر:https://go.hyper.ai/Vf3mq

دروس تعليمية عامة مختارة
1. عرض توضيحي لبرنامج InkSight لتحويل النصوص المكتوبة بخط اليد إلى صيغة رقمية
InkSight هي تقنية للتعرف على النصوص المكتوبة بخط اليد ورقمنتها. تحاكي التكنولوجيا عملية القراءة والتعلم البشرية من خلال إعادة الكتابة والتعلم بشكل مستمر من النص المكتوب بخط اليد، وبالتالي تراكم الفهم لمظهر النص ومعناه. بالمقارنة مع تقنية التعرف الضوئي على الحروف (OCR) التقليدية، تُظهر تقنية InkSight دقة أعلى في التعرف عند التعامل مع نص مكتوب بخط اليد في خلفيات معقدة، أو نص غير واضح، أو ظروف الإضاءة المنخفضة.
يمكن لهذا المشروع إنشاء واجهة تفاعلية أمامية من خلال واجهة Gradio. لقد تم نشر النماذج والتبعيات ذات الصلة. يمكنك تجربة تحويل الكتابة اليدوية بنقرة واحدة عند بدء التشغيل.
تشغيل عبر الإنترنت:https://go.hyper.ai/gVh8a

2. يُنشئ CharacterGen شخصيات ثلاثية الأبعاد عالية الجودة من صورة واحدة
يقوم CharacterGen بأخذ صورة إدخال واحدة وإنشاء شبكة أحرف موحدة ثلاثية الأبعاد بجودة عالية ومظهر متناسق، وجاهزة للاستخدام في عمليات التجهيز اللاحقة وتدفقات الرسوم المتحركة.
يعد هذا البرنامج التعليمي عرضًا توضيحيًا لـ CharacterGen بنقرة واحدة. تم تثبيت البيئة والتبعيات ذات الصلة. يمكنك تجربة إنشاء شخصيات ثلاثية الأبعاد عالية الجودة عن طريق الاستنساخ والبدء.
تشغيل عبر الإنترنت:https://go.hyper.ai/jtVAF

3. نشر Ministral-8B-Instruct-2410 بنقرة واحدة
Ministral-8B هو نموذج لغوي تم تطويره بواسطة فريق Mistral AI خصيصًا لأجهزة الحافة وسيناريوهات الحوسبة الحافة. يمكنه أداء مهام متعددة، بما في ذلك الإجابة على الأسئلة، وترجمة النصوص إلى لغات مختلفة، وإعداد ملخصات المستندات، والمساعدة في كتابة المقالات والتقارير. إنه يعتمد على وضع انتباه نافذة انزلاقية متداخلة، والذي لا يعمل على تحسين سرعة استنتاج النموذج فحسب، بل يقلل أيضًا من استخدام الذاكرة بشكل كبير، مما يجعله مناسبًا جدًا للتشغيل على أجهزة الحافة ذات الموارد المحدودة.
انتقل إلى الموقع الرسمي لاستنساخ الحاوية وبدء تشغيلها، ثم انسخ عنوان API مباشرةً، ويمكنك التواصل مع النموذج.
تشغيل عبر الإنترنت:https://go.hyper.ai/wMQWN

4. برنامج VASP التعليمي: 1-1. حساب DFT لذرات الأكسجين المعزولة
VASP عبارة عن حزمة برمجية لإجراء حسابات البنية الإلكترونية ومحاكاة ميكانيكا الكم والديناميكا الجزيئية. وهو أحد البرامج التجارية الأكثر شعبية لمحاكاة المواد وأبحاث علوم المواد الحسابية. إن دقتها العالية ووظائفها القوية تجعلها أداة مهمة للباحثين للتنبؤ بخصائص المواد وتصميمها. يتم استخدامه على نطاق واسع في الفيزياء الصلبة، وعلوم المواد، والكيمياء، والديناميكيات الجزيئية وغيرها من المجالات.
هذا البرنامج التعليمي هو الجزء الأول من البرنامج التعليمي الرسمي لـ VASP: حسابات DFT لذرات الأكسجين المعزولة. انقر على الرابط أدناه واتبع البرنامج التعليمي لبدء حسابات DFT عالية الأداء من الصفر.
تشغيل عبر الإنترنت:https://go.hyper.ai/pa2NX
💡لقد قمنا أيضًا بتأسيس مجموعة تبادل تعليمية حول الانتشار المستقر. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة والتعليق على [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق ~

مقالات المجتمع
وبما أن تطوير الأدوية يفتقر إلى نموذج قياسي موحد، فإن عملية التطوير معقدة وتتطلب تصنيفًا دقيقًا للبيانات، مما يحد من تطبيق نماذج اللغة الكبيرة في مجال تطوير الأدوية. ردًا على ذلك، اقترحت فرق بحثية من أربع جامعات كبرى بشكل مشترك نموذجًا لغويًا كبيرًا Y-Mol مسترشدًا بالمعرفة الطبية الحيوية متعددة المقاييس. يمكن ضبطه على مجموعات نصية وتعليمات مختلفة، مما يعزز أداء النموذج وإمكاناته في تطوير الأدوية. هذه المقالة عبارة عن تفسير مفصل ومشاركة لورقة البحث.
شاهد التقرير الكامل:https://go.hyper.ai/14X5I
باعتباره أحد الخبراء العالميين في مجال تصميم البروتينات، قام ديفيد بيكر بجعل العديد من أدوات التعلم العميق مفتوحة المصدر. وهو أيضًا "الملك الأكاديمي"، إذ نشر أكثر من 700 ورقة بحثية في مجال البروتين، بإجمالي 177 ألف استشهاد. كان ديفيد بيكر مشاركًا مباشرًا كمؤسس في تطوير 21 شركة في مجالات تشمل علاج الأمراض وإنتاج الأغذية وعلوم المواد. انقر هنا لقراءة ومعرفة المزيد عن تجربة ديفيد بيكر الأسطورية.
شاهد التقرير الكامل:https://go.hyper.ai/ItxvG
في منتدى COSCon'24 للذكاء الاصطناعي من أجل العلوم الذي شاركت في إنتاجه شركة HyperAI، ألقى جينغتاو دينغ، باحث ما بعد الدكتوراه من مركز العلوم الحضرية والبحوث الحاسوبية، قسم الهندسة الإلكترونية، جامعة تسينغهوا، كلمة بعنوان "النمذجة المعتمدة على الذكاء الاصطناعي واكتشاف الأنماط للأنظمة الحضرية المعقدة". وقد قدم شرحًا معمقًا لطريقة النمذجة التوليدية المكانية الزمنية للأنظمة الحضرية المعقدة وأحدث التقدم البحثي الذي أحرزه الفريق. مليئة بالمعلومات المفيدة، انقر للقراءة.
شاهد التقرير الكامل:https://go.hyper.ai/qaDYE
في 13 نوفمبر، أجرى هوانغ رينكسون وسون ماسايوشي محادثة غير متصلة بالإنترنت في اليابان، حيث استعرضا استثمارات الأخير السابقة في إنفيديا وناقشا تطوير الذكاء الاصطناعي في اليابان. صرح هوانج رينكسون بصراحة أن ماسايوشي سون هو "رجل الأعمال والمبتكر الوحيد في العالم الذي اختار الفائزين وعمل مع الفائزين في كل جيل من التغيير التكنولوجي". تسلط هذه المقالة الضوء على النزاعات السابقة بين الطرفين واتجاه التنمية الحالي. انقر لقراءة التفاصيل.
شاهد التقرير الكامل:https://go.hyper.ai/hLKbG
مقالات موسوعية شعبية
1. إطار عمل محاذاة UNA
2. ابن العم الرقمي
3. انهيار النموذج
4. تعزيز التدرج
5. مبدأ التردد
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة
* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:
وأخيرًا، أوصي ببرنامج "حوافز المبدعين". يمكن للأصدقاء المهتمين مسح رمز الاستجابة السريعة للمشاركة!
