تغلب على صعوبات التعرف على خط اليد OCR! تم إطلاق برنامج InkSight التعليمي، لتحقيق نسخ عالي الدقة؛ تم إصدار مجموعة بيانات iNatSounds، التي تحتوي على 230,000 صوتًا للأنواع الطبيعية

منذ 2 أعوام

تعد الملاحظات المكتوبة بخط اليد هي الطريقة التي يسجل بها العديد من الأشخاص الإلهام في حياتهم اليومية، ولكن كيفية تحويل المحتوى المكتوب بخط اليد إلى نص إلكتروني بكفاءة كانت دائمًا تحديًا كبيرًا. غالبًا ما تكون دقة تقنية التعرف الضوئي على الحروف (OCR) التقليدية محدودة عند التعامل مع خلفيات معقدة أو خط يد غير منتظم.

ولحل هذه المشكلة، أطلقت جوجل للأبحاث مؤخرًا تقنية InkSight، التي تحاكي عملية القراءة البشرية من خلال التعلم العميق، وتتعرف بدقة على النص المكتوب بخط اليد وتستعيد أسلوبه تمامًا. على عكس تقنية التعرف الضوئي على الحروف التقليدية، لا يزال بإمكان InkSight الحفاظ على دقة عالية في الإضاءة المنخفضة أو الخلفيات المعقدة، ودعم النسخ على مستوى الكلمة والصفحة الكاملة، ويكون التأثير مماثلاً تقريبًا للكتابة اليدوية الأصلية. وقد أظهرت هذه التكنولوجيا إمكانات كبيرة في مجالات مثل رقمنة الوثائق وحماية التراث الثقافي.

من أجل مساعدة العديد من عشاق الكتابة اليدوية على رقمنة إبداعاتهم بسهولة وتسهيل النسخ عالي الدقة للوثائق الثمينة،أصبح البرنامج التعليمي الخاص بـ InkSight متاحًا الآن على الموقع الرسمي لـ hyper.ai. يمكنك تجربته عن طريق استنساخه بنقرة واحدة~

تشغيل عبر الإنترنت:https://go.hyper.ai/gVh8a

من 11 نوفمبر إلى 15 نوفمبر، تحديثات الموقع الرسمي لـ hyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 6

* اختيار المقالات المجتمعية: 4 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات مع الموعد النهائي في نوفمبر: 2

قم بزيارة الموقع الرسمي: hyper.ai

مجموعات البيانات العامة المختارة

1. مجموعة بيانات القيادة الذاتية DrivingDojo

تحتوي مجموعة بيانات القيادة الذاتية DrivingDojo على حوالي 18 ألف مقطع فيديو، وهي مصممة خصيصًا لمحاكاة التفاعلات البصرية في العالم الحقيقي وتغطي إجراءات القيادة الغنية والتفاعلات بين العديد من الوكلاء ومعرفة القيادة في العالم المفتوح. تهدف مجموعة البيانات هذه إلى تعزيز تطوير النماذج التفاعلية والمستنيرة لعالم القيادة.

الاستخدام المباشر:https://go.hyper.ai/Y86yY

2. مجموعة بيانات صور الطرق السريعة الأمريكية TuSimple

تحتوي مجموعة بيانات TuSimple على 6,408 صورة للطرق السريعة في الولايات المتحدة، بما في ذلك 3,626 للتدريب، و358 للتحقق، و2,782 للاختبار. دقة الصورة هي 1280×720، وجميع الصور تم التقاطها في ظل ظروف جوية مختلفة.

الاستخدام المباشر:https://go.hyper.ai/Mo6bt

3. تصنيف الرياضة - مجموعة بيانات 100 صورة رياضية

تغطي مجموعة البيانات هذه مجموعة من صور الحركة لـ 100 رياضة مختلفة، وجميع الصور بتنسيق jpg 224x224x3. يتم تقسيم البيانات إلى صور تدريبية وصور اختبار وصور التحقق. بالإضافة إلى ذلك، تأتي مجموعة البيانات مع ملف CSV لتسهيل قيام الباحثين بتحميل بيانات الصور هذه ومعالجتها.

الاستخدام المباشر:https://go.hyper.ai/715At

4. أنواع النباتات المنزلية: مجموعة بيانات تضم 47 نوعًا من النباتات الداخلية

تم جمع مجموعة البيانات من Bing Images وتحتوي على 14,790 صورة مصنفة إلى 47 فئة مختلفة من أنواع النباتات.

الاستخدام المباشر:https://go.hyper.ai/v7wTX

5.مجموعة بيانات التنوع البيولوجي للحشرات متعددة الوسائط BIOSCAN-5M

BIOSCAN-5M هي مجموعة بيانات شاملة ومتعددة الوسائط للتنوع البيولوجي للحشرات مصممة لفهم ومراقبة التنوع البيولوجي العالمي للحشرات. تحتوي مجموعة البيانات على معلومات مفصلة عن أكثر من 5 ملايين عينة حشرية، مما يؤدي إلى توسيع مجموعات البيانات البيولوجية القائمة على الصور بشكل كبير.

الاستخدام المباشر:https://go.hyper.ai/YDeuN

6. مجموعة بيانات أصوات iNaturalist مجموعة بيانات أصوات الأنواع الطبيعية

مجموعة البيانات عبارة عن مجموعة من ملفات الصوت الخاصة بالأنواع الطبيعية، والتي تجمع 230 ألف ملف صوتي، تلتقط الأصوات من أكثر من 5.5 ألف نوع، ساهم بها أكثر من 27 ألف مسجل في جميع أنحاء العالم.

الاستخدام المباشر:https://go.hyper.ai/S0lg6

7. مجموعة بيانات الأقمار الصناعية عالية الدقة OpenSatMap

OpenSatMap عبارة عن مجموعة بيانات أقمار صناعية عالية الدقة مصممة لبناء خرائط واسعة النطاق. ويحتوي الكتاب على صور ليس فقط للعديد من المدن في الصين، بل أيضًا لأكثر من 50 مدينة و18 دولة حول العالم. تتمتع هذه الصور بدقة 20 مستوى، وهي الأعلى بين مجموعات بيانات الأقمار الصناعية الموجودة.

الاستخدام المباشر:https://go.hyper.ai/PtbCB

8. مجموعة بيانات صور البطاقات

صورة البطاقات هي مجموعة بيانات لصور بطاقات اللعب. تحتوي مجموعة البيانات على 7624 صورة تدريبية، و265 صورة اختبار، و265 صورة للتحقق. جميع الصور بصيغة jpg 224x224x3. تم اقتصاص كل صورة بعناية لإظهار بطاقة لعب واحدة فقط، وتحتل أكثر من 50% بكسل من الصورة.

الاستخدام المباشر:https://go.hyper.ai/DuOJb

9. مجموعة بيانات أزواج الصور والنصوص واسعة النطاق PD12M

PD12M هي أكبر مجموعة بيانات لأزواج الصور والنصوص في المجال العام، وتحتوي على 12.4 مليون صورة عالية الجودة مرخصة في المجال العام وCCO مع تعليقات توضيحية اصطناعية، تُستخدم بشكل أساسي لتدريب نماذج النص إلى صورة.

الاستخدام المباشر:https://go.hyper.ai/xyjrD

10. مجموعة بيانات MINT-1T النصية متعددة الوسائط للصور

مجموعة البيانات MINT-1T عبارة عن مجموعة بيانات متعددة الوسائط تحتوي على تريليون علامة نصية و3.4 مليار صورة، وهو ما يزيد بمقدار 10 أضعاف عن حجم أكبر مجموعة بيانات مفتوحة المصدر سابقة. لا تشتمل مجموعة البيانات على مستندات HTML فحسب، بل تشتمل أيضًا على مستندات PDF وأوراق ArXiv، مما يحسن بشكل كبير تغطية المستندات العلمية.

الاستخدام المباشر:https://go.hyper.ai/Vf3mq

دروس تعليمية عامة مختارة

1. عرض توضيحي لبرنامج InkSight لتحويل النصوص المكتوبة بخط اليد إلى صيغة رقمية

InkSight هي تقنية للتعرف على النصوص المكتوبة بخط اليد ورقمنتها. تحاكي التكنولوجيا عملية القراءة والتعلم البشرية من خلال إعادة الكتابة والتعلم بشكل مستمر من النص المكتوب بخط اليد، وبالتالي تراكم الفهم لمظهر النص ومعناه. بالمقارنة مع تقنية التعرف الضوئي على الحروف (OCR) التقليدية، تُظهر تقنية InkSight دقة أعلى في التعرف عند التعامل مع نص مكتوب بخط اليد في خلفيات معقدة، أو نص غير واضح، أو ظروف الإضاءة المنخفضة.

يمكن لهذا المشروع إنشاء واجهة تفاعلية أمامية من خلال واجهة Gradio. لقد تم نشر النماذج والتبعيات ذات الصلة. يمكنك تجربة تحويل الكتابة اليدوية بنقرة واحدة عند بدء التشغيل.

تشغيل عبر الإنترنت:https://go.hyper.ai/gVh8a

2. يُنشئ CharacterGen شخصيات ثلاثية الأبعاد عالية الجودة من صورة واحدة

يقوم CharacterGen بأخذ صورة إدخال واحدة وإنشاء شبكة أحرف موحدة ثلاثية الأبعاد بجودة عالية ومظهر متناسق، وجاهزة للاستخدام في عمليات التجهيز اللاحقة وتدفقات الرسوم المتحركة.

يعد هذا البرنامج التعليمي عرضًا توضيحيًا لـ CharacterGen بنقرة واحدة. تم تثبيت البيئة والتبعيات ذات الصلة. يمكنك تجربة إنشاء شخصيات ثلاثية الأبعاد عالية الجودة عن طريق الاستنساخ والبدء.

تشغيل عبر الإنترنت:https://go.hyper.ai/jtVAF

3. نشر Ministral-8B-Instruct-2410 بنقرة واحدة

Ministral-8B هو نموذج لغوي تم تطويره بواسطة فريق Mistral AI خصيصًا لأجهزة الحافة وسيناريوهات الحوسبة الحافة. يمكنه أداء مهام متعددة، بما في ذلك الإجابة على الأسئلة، وترجمة النصوص إلى لغات مختلفة، وإعداد ملخصات المستندات، والمساعدة في كتابة المقالات والتقارير. إنه يعتمد على وضع انتباه نافذة انزلاقية متداخلة، والذي لا يعمل على تحسين سرعة استنتاج النموذج فحسب، بل يقلل أيضًا من استخدام الذاكرة بشكل كبير، مما يجعله مناسبًا جدًا للتشغيل على أجهزة الحافة ذات الموارد المحدودة.

انتقل إلى الموقع الرسمي لاستنساخ الحاوية وبدء تشغيلها، ثم انسخ عنوان API مباشرةً، ويمكنك التواصل مع النموذج.

تشغيل عبر الإنترنت:https://go.hyper.ai/wMQWN

4. برنامج VASP التعليمي: 1-1. حساب DFT لذرات الأكسجين المعزولة

VASP عبارة عن حزمة برمجية لإجراء حسابات البنية الإلكترونية ومحاكاة ميكانيكا الكم والديناميكا الجزيئية. وهو أحد البرامج التجارية الأكثر شعبية لمحاكاة المواد وأبحاث علوم المواد الحسابية. إن دقتها العالية ووظائفها القوية تجعلها أداة مهمة للباحثين للتنبؤ بخصائص المواد وتصميمها. يتم استخدامه على نطاق واسع في الفيزياء الصلبة، وعلوم المواد، والكيمياء، والديناميكيات الجزيئية وغيرها من المجالات.

هذا البرنامج التعليمي هو الجزء الأول من البرنامج التعليمي الرسمي لـ VASP: حسابات DFT لذرات الأكسجين المعزولة. انقر على الرابط أدناه واتبع البرنامج التعليمي لبدء حسابات DFT عالية الأداء من الصفر.

تشغيل عبر الإنترنت:https://go.hyper.ai/pa2NX

💡لقد قمنا أيضًا بتأسيس مجموعة تبادل تعليمية حول الانتشار المستقر. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة والتعليق على [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق ~

مقالات المجتمع

1. أولاً! أطلقت أربع جامعات كبرى بشكل مشترك Y-Mol، وهو نموذج لغوي كبير للبحث والتطوير في مجال الأدوية، مع أداء إجمالي يقود LLaMA2

وبما أن تطوير الأدوية يفتقر إلى نموذج قياسي موحد، فإن عملية التطوير معقدة وتتطلب تصنيفًا دقيقًا للبيانات، مما يحد من تطبيق نماذج اللغة الكبيرة في مجال تطوير الأدوية. ردًا على ذلك، اقترحت فرق بحثية من أربع جامعات كبرى بشكل مشترك نموذجًا لغويًا كبيرًا Y-Mol مسترشدًا بالمعرفة الطبية الحيوية متعددة المقاييس. يمكن ضبطه على مجموعات نصية وتعليمات مختلفة، مما يعزز أداء النموذج وإمكاناته في تطوير الأدوية. هذه المقالة عبارة عن تفسير مفصل ومشاركة لورقة البحث.

شاهد التقرير الكامل:https://go.hyper.ai/14X5I

2. من قسم الفلسفة بجامعة هارفارد إلى أستاذ تصميم البروتين، ديفيد بيكر: لقد جعلني برنامج AlphaFold أدرك بعمق قوة التعلم العميق

باعتباره أحد الخبراء العالميين في مجال تصميم البروتينات، قام ديفيد بيكر بجعل العديد من أدوات التعلم العميق مفتوحة المصدر. وهو أيضًا "الملك الأكاديمي"، إذ نشر أكثر من 700 ورقة بحثية في مجال البروتين، بإجمالي 177 ألف استشهاد. كان ديفيد بيكر مشاركًا مباشرًا كمؤسس في تطوير 21 شركة في مجالات تشمل علاج الأمراض وإنتاج الأغذية وعلوم المواد. انقر هنا لقراءة ومعرفة المزيد عن تجربة ديفيد بيكر الأسطورية.

شاهد التقرير الكامل:https://go.hyper.ai/ItxvG

3. من خلال جمع أكثر من 20 مجموعة بيانات مكانية وزمانية وأكثر من 130 مليون نقطة عينة، اقترح فريق بحث Tsinghua 3 طرق لنمذجة النظام الحضري المعقد استنادًا إلى الذكاء الاصطناعي التوليدي

في منتدى COSCon'24 للذكاء الاصطناعي من أجل العلوم الذي شاركت في إنتاجه شركة HyperAI، ألقى جينغتاو دينغ، باحث ما بعد الدكتوراه من مركز العلوم الحضرية والبحوث الحاسوبية، قسم الهندسة الإلكترونية، جامعة تسينغهوا، كلمة بعنوان "النمذجة المعتمدة على الذكاء الاصطناعي واكتشاف الأنماط للأنظمة الحضرية المعقدة". وقد قدم شرحًا معمقًا لطريقة النمذجة التوليدية المكانية الزمنية للأنظمة الحضرية المعقدة وأحدث التقدم البحثي الذي أحرزه الفريق. مليئة بالمعلومات المفيدة، انقر للقراءة.

شاهد التقرير الكامل:https://go.hyper.ai/qaDYE

4. يتحدث Jen-Hsun Huang مع Masayoshi Son: فطيرة الذكاء الاصطناعي اليابانية الجديدة وطموحات Arm للذكاء الاصطناعي وفرص NVIDIA الجديدة في شرق آسيا

في 13 نوفمبر، أجرى هوانغ رينكسون وسون ماسايوشي محادثة غير متصلة بالإنترنت في اليابان، حيث استعرضا استثمارات الأخير السابقة في إنفيديا وناقشا تطوير الذكاء الاصطناعي في اليابان. صرح هوانج رينكسون بصراحة أن ماسايوشي سون هو "رجل الأعمال والمبتكر الوحيد في العالم الذي اختار الفائزين وعمل مع الفائزين في كل جيل من التغيير التكنولوجي". تسلط هذه المقالة الضوء على النزاعات السابقة بين الطرفين واتجاه التنمية الحالي. انقر لقراءة التفاصيل.

شاهد التقرير الكامل:https://go.hyper.ai/hLKbG

مقالات موسوعية شعبية

1. إطار عمل محاذاة UNA

2. ابن العم الرقمي

3. انهيار النموذج

4. تعزيز التدرج

5. مبدأ التردد

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة

* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 100 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai/

وأخيرًا، أوصي ببرنامج "حوافز المبدعين". يمكن للأصدقاء المهتمين مسح رمز الاستجابة السريعة للمشاركة!

تغلب على صعوبات التعرف على خط اليد OCR! تم إطلاق برنامج InkSight التعليمي، لتحقيق نسخ عالي الدقة؛ تم إصدار مجموعة بيانات iNatSounds، التي تحتوي على 230,000 صوتًا للأنواع الطبيعية

منذ 2 أعوام

تشغيل عبر الإنترنت:https://go.hyper.ai/gVh8a

من 11 نوفمبر إلى 15 نوفمبر، تحديثات الموقع الرسمي لـ hyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 6

* اختيار المقالات المجتمعية: 4 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات مع الموعد النهائي في نوفمبر: 2

قم بزيارة الموقع الرسمي: hyper.ai

مجموعات البيانات العامة المختارة

1. مجموعة بيانات القيادة الذاتية DrivingDojo

الاستخدام المباشر:https://go.hyper.ai/Y86yY

2. مجموعة بيانات صور الطرق السريعة الأمريكية TuSimple

الاستخدام المباشر:https://go.hyper.ai/Mo6bt

3. تصنيف الرياضة - مجموعة بيانات 100 صورة رياضية

الاستخدام المباشر:https://go.hyper.ai/715At

4. أنواع النباتات المنزلية: مجموعة بيانات تضم 47 نوعًا من النباتات الداخلية

تم جمع مجموعة البيانات من Bing Images وتحتوي على 14,790 صورة مصنفة إلى 47 فئة مختلفة من أنواع النباتات.

الاستخدام المباشر:https://go.hyper.ai/v7wTX

5.مجموعة بيانات التنوع البيولوجي للحشرات متعددة الوسائط BIOSCAN-5M

الاستخدام المباشر:https://go.hyper.ai/YDeuN

6. مجموعة بيانات أصوات iNaturalist مجموعة بيانات أصوات الأنواع الطبيعية

الاستخدام المباشر:https://go.hyper.ai/S0lg6

7. مجموعة بيانات الأقمار الصناعية عالية الدقة OpenSatMap

الاستخدام المباشر:https://go.hyper.ai/PtbCB

8. مجموعة بيانات صور البطاقات

الاستخدام المباشر:https://go.hyper.ai/DuOJb

9. مجموعة بيانات أزواج الصور والنصوص واسعة النطاق PD12M

الاستخدام المباشر:https://go.hyper.ai/xyjrD

10. مجموعة بيانات MINT-1T النصية متعددة الوسائط للصور

الاستخدام المباشر:https://go.hyper.ai/Vf3mq

دروس تعليمية عامة مختارة

1. عرض توضيحي لبرنامج InkSight لتحويل النصوص المكتوبة بخط اليد إلى صيغة رقمية

تشغيل عبر الإنترنت:https://go.hyper.ai/gVh8a

2. يُنشئ CharacterGen شخصيات ثلاثية الأبعاد عالية الجودة من صورة واحدة

تشغيل عبر الإنترنت:https://go.hyper.ai/jtVAF

3. نشر Ministral-8B-Instruct-2410 بنقرة واحدة

انتقل إلى الموقع الرسمي لاستنساخ الحاوية وبدء تشغيلها، ثم انسخ عنوان API مباشرةً، ويمكنك التواصل مع النموذج.

تشغيل عبر الإنترنت:https://go.hyper.ai/wMQWN

4. برنامج VASP التعليمي: 1-1. حساب DFT لذرات الأكسجين المعزولة

تشغيل عبر الإنترنت:https://go.hyper.ai/pa2NX

مقالات المجتمع

شاهد التقرير الكامل:https://go.hyper.ai/14X5I

شاهد التقرير الكامل:https://go.hyper.ai/ItxvG

شاهد التقرير الكامل:https://go.hyper.ai/qaDYE

شاهد التقرير الكامل:https://go.hyper.ai/hLKbG

مقالات موسوعية شعبية

1. إطار عمل محاذاة UNA

2. ابن العم الرقمي

3. انهيار النموذج

4. تعزيز التدرج

5. مبدأ التردد

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event

نراكم في الاسبوع القادم!

حول HyperAI

* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة

* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 100 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai/

وأخيرًا، أوصي ببرنامج "حوافز المبدعين". يمكن للأصدقاء المهتمين مسح رمز الاستجابة السريعة للمشاركة!

تغلب على صعوبات التعرف على خط اليد OCR! تم إطلاق برنامج InkSight التعليمي، لتحقيق نسخ عالي الدقة؛ تم إصدار مجموعة بيانات iNatSounds، التي تحتوي على 230,000 صوتًا للأنواع الطبيعية

مجموعات البيانات العامة المختارة

دروس تعليمية عامة مختارة

مقالات المجتمع

مقالات موسوعية شعبية

حول HyperAI

تغلب على صعوبات التعرف على خط اليد OCR! تم إطلاق برنامج InkSight التعليمي، لتحقيق نسخ عالي الدقة؛ تم إصدار مجموعة بيانات iNatSounds، التي تحتوي على 230,000 صوتًا للأنواع الطبيعية

مجموعات البيانات العامة المختارة

دروس تعليمية عامة مختارة

مقالات المجتمع

مقالات موسوعية شعبية

حول HyperAI

ذات صلة الأخبار

سريع ودقيق! شركة Cohere تُصدر نموذج نسخ مفتوح المصدر؛ تحليل دقيق للسيناريوهات المعقدة: نموذج اللغة المرئي Chandra-ocr-2 يحقق التعرف الضوئي على الأحرف بدقة عالية.

حقق "حرية التعليق الصوتي" باستخدام 3 ثوانٍ فقط من الصوت: نموذج الكلام مفتوح المصدر Mistral Voxtral-4B-TTS-2603؛ وضع معيارًا جديدًا لجودة البيانات: Sutra 10B Pretraining.

تغلب على صعوبات التعرف على خط اليد OCR! تم إطلاق برنامج InkSight التعليمي، لتحقيق نسخ عالي الدقة؛ تم إصدار مجموعة بيانات iNatSounds، التي تحتوي على 230,000 صوتًا للأنواع الطبيعية

مجموعات البيانات العامة المختارة

دروس تعليمية عامة مختارة

مقالات المجتمع

مقالات موسوعية شعبية

حول HyperAI

ذات صلة الأخبار

سريع ودقيق! شركة Cohere تُصدر نموذج نسخ مفتوح المصدر؛ تحليل دقيق للسيناريوهات المعقدة: نموذج اللغة المرئي Chandra-ocr-2 يحقق التعرف الضوئي على الأحرف بدقة عالية.

حقق "حرية التعليق الصوتي" باستخدام 3 ثوانٍ فقط من الصوت: نموذج الكلام مفتوح المصدر Mistral Voxtral-4B-TTS-2603؛ وضع معيارًا جديدًا لجودة البيانات: Sutra 10B Pretraining.

ذات صلة الأخبار

سريع ودقيق! شركة Cohere تُصدر نموذج نسخ مفتوح المصدر؛ تحليل دقيق للسيناريوهات المعقدة: نموذج اللغة المرئي Chandra-ocr-2 يحقق التعرف الضوئي على الأحرف بدقة عالية.

حقق "حرية التعليق الصوتي" باستخدام 3 ثوانٍ فقط من الصوت: نموذج الكلام مفتوح المصدر Mistral Voxtral-4B-TTS-2603؛ وضع معيارًا جديدًا لجودة البيانات: Sutra 10B Pretraining.

ذات صلة الأخبار

سريع ودقيق! شركة Cohere تُصدر نموذج نسخ مفتوح المصدر؛ تحليل دقيق للسيناريوهات المعقدة: نموذج اللغة المرئي Chandra-ocr-2 يحقق التعرف الضوئي على الأحرف بدقة عالية.

حقق "حرية التعليق الصوتي" باستخدام 3 ثوانٍ فقط من الصوت: نموذج الكلام مفتوح المصدر Mistral Voxtral-4B-TTS-2603؛ وضع معيارًا جديدًا لجودة البيانات: Sutra 10B Pretraining.

Command Palette

تغلب على صعوبات التعرف على خط اليد OCR! تم إطلاق برنامج InkSight التعليمي، لتحقيق نسخ عالي الدقة؛ تم إصدار مجموعة بيانات iNatSounds، التي تحتوي على 230,000 صوتًا للأنواع الطبيعية

مجموعات البيانات العامة المختارة

دروس تعليمية عامة مختارة

مقالات المجتمع

مقالات موسوعية شعبية

حول HyperAI

Command Palette

تغلب على صعوبات التعرف على خط اليد OCR! تم إطلاق برنامج InkSight التعليمي، لتحقيق نسخ عالي الدقة؛ تم إصدار مجموعة بيانات iNatSounds، التي تحتوي على 230,000 صوتًا للأنواع الطبيعية

مجموعات البيانات العامة المختارة

دروس تعليمية عامة مختارة

مقالات المجتمع

مقالات موسوعية شعبية

حول HyperAI

ذات صلة الأخبار

سريع ودقيق! شركة Cohere تُصدر نموذج نسخ مفتوح المصدر؛ تحليل دقيق للسيناريوهات المعقدة: نموذج اللغة المرئي Chandra-ocr-2 يحقق التعرف الضوئي على الأحرف بدقة عالية.

حقق "حرية التعليق الصوتي" باستخدام 3 ثوانٍ فقط من الصوت: نموذج الكلام مفتوح المصدر Mistral Voxtral-4B-TTS-2603؛ وضع معيارًا جديدًا لجودة البيانات: Sutra 10B Pretraining.

Command Palette

تغلب على صعوبات التعرف على خط اليد OCR! تم إطلاق برنامج InkSight التعليمي، لتحقيق نسخ عالي الدقة؛ تم إصدار مجموعة بيانات iNatSounds، التي تحتوي على 230,000 صوتًا للأنواع الطبيعية

مجموعات البيانات العامة المختارة

دروس تعليمية عامة مختارة

مقالات المجتمع

مقالات موسوعية شعبية

حول HyperAI

ذات صلة الأخبار

سريع ودقيق! شركة Cohere تُصدر نموذج نسخ مفتوح المصدر؛ تحليل دقيق للسيناريوهات المعقدة: نموذج اللغة المرئي Chandra-ocr-2 يحقق التعرف الضوئي على الأحرف بدقة عالية.

حقق "حرية التعليق الصوتي" باستخدام 3 ثوانٍ فقط من الصوت: نموذج الكلام مفتوح المصدر Mistral Voxtral-4B-TTS-2603؛ وضع معيارًا جديدًا لجودة البيانات: Sutra 10B Pretraining.

ذات صلة الأخبار

سريع ودقيق! شركة Cohere تُصدر نموذج نسخ مفتوح المصدر؛ تحليل دقيق للسيناريوهات المعقدة: نموذج اللغة المرئي Chandra-ocr-2 يحقق التعرف الضوئي على الأحرف بدقة عالية.

حقق "حرية التعليق الصوتي" باستخدام 3 ثوانٍ فقط من الصوت: نموذج الكلام مفتوح المصدر Mistral Voxtral-4B-TTS-2603؛ وضع معيارًا جديدًا لجودة البيانات: Sutra 10B Pretraining.

ذات صلة الأخبار

سريع ودقيق! شركة Cohere تُصدر نموذج نسخ مفتوح المصدر؛ تحليل دقيق للسيناريوهات المعقدة: نموذج اللغة المرئي Chandra-ocr-2 يحقق التعرف الضوئي على الأحرف بدقة عالية.

حقق "حرية التعليق الصوتي" باستخدام 3 ثوانٍ فقط من الصوت: نموذج الكلام مفتوح المصدر Mistral Voxtral-4B-TTS-2603؛ وضع معيارًا جديدًا لجودة البيانات: Sutra 10B Pretraining.