التاريخ

منذ 2 أعوام

الحجم

189.87 GB

المؤسسة

عنوان URL للنشر

رابط الورقة البحثية

الوسوم

المعالجة الصوتية والصوتية

التعرف على الصوت

VoiceAssistant-400K عبارة عن مجموعة بيانات مُحسّنة للمساعدين الصوتيين. ويهدف هذا إلى مساعدة النموذج على تقليل إنشاء رموز التعليمات البرمجية عند تقديم خدمات المساعد الصوتي وتعزيز التطبيق العملي للنموذج في التطبيقات الحقيقية. تم تطوير مجموعة البيانات هذه لتدريب وتحسين مخرجات الكلام لنموذج Mini-Omni. تم إطلاقه من قبل فريق بحثي من جامعة تسينغهوا في عام 2024. نتائج الورقة ذات الصلة هي "Mini-Omni: نماذج اللغة قادرة على السمع والتحدث أثناء التفكير في البث المباشرميني-أومني هو نموذج لغوي واسع النطاق ومتعدد الوسائط ومفتوح المصدر، يتميز بإمكانيات محادثة آنية وإدخال وإخراج كلامي شامل. من خلال نهج فريد لتوليد الكلام بالتوازي، يتم تحقيق مخرجات منطقية للكلام متوافقة مع القدرات النصية، دون الحاجة إلا إلى بيانات ووحدات إضافية قليلة. تعمل مجموعة البيانات VoiceAssistant-400K على تحسين محولات الكلام إلى نص والنص إلى كلام من خلال عملية تدريب مكونة من ثلاث مراحل لدعم أداء النماذج عند تقديم خدمات المساعد الصوتي. تتضمن هذه المراحل محاذاة الوسائط، والتدريب على التكيف، والضبط الدقيق للوسائط المتعددة. في مرحلة محاذاة الوسائط، يتم تدريب قدرات التعرف على الكلام وتوليفه في النموذج باستخدام البيانات من التعرف على الكلام وتوليفه. تركز مرحلة تدريب التكيف على تدريب القدرات النصية للنموذج من خلال إدخال الصوت. تستخدم مرحلة الضبط الدقيق متعدد الوسائط النهائية البيانات الاصطناعية لضبط النموذج بأكمله لضمان جودة الناتج متعدد الوسائط.

VoiceAssistant-400K.torrent

البذر 1جارٍ التنزيل 0مكتمل 290إجمالي التنزيلات 309

VoiceAssistant-400K/
- README.md
  1.97 KB
- README.txt
  3.95 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعة بيانات LightOnOCR-mix-0126 لنسخ النصوص

منذ 5 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار