مجموعة بيانات التعرف على الكلام متعدد الوسائط Chinese-LiPS
التاريخ
منذ 2 أيام
رابط النشر
Chinese-LiPS هي مجموعة بيانات للتعرف على الكلام متعدد الوسائط، أصدرها معهد تشي يوان للأبحاث وجامعة نانكاي عام ٢٠٢٥. وجاءت نتيجة البحث العلمي ذي الصلة: "Chinese-LiPS: مجموعة بيانات للتعرف على الكلام السمعي البصري الصيني مع قراءة الشفاه وشرائح العرض". وبصفتها أول مجموعة بيانات صينية للتعرف على الكلام متعدد الوسائط تجمع بين "معلومات قراءة الشفاه والمعلومات الدلالية للشرائح"، تستهدف Chinese-LiPS سياقات معقدة مثل شرح اللغة الصينية، والعلوم الشعبية، والتدريس، ونشر المعرفة، وهي ملتزمة بتعزيز تطوير تقنية التعرف على الكلام متعدد الوسائط الصينية.
ميزات مجموعة البيانات:
- حجم البيانات كبيريبلغ إجمالي طول Chinese-LiPS حوالي 100 ساعة ويحتوي على 36208 مقطع صوتي عالي الجودة سجله 207 متحدثًا محترفًا، مع تمثيل جيد وتنوع.
- تغطية مجموعة واسعة من المواضيعيغطي المحتوى 9 مجالات شائعة بما في ذلك العلوم والتكنولوجيا، والصحة والعافية، والثقافة والتاريخ، والسياحة والاستكشاف، وصناعة السيارات، والأحداث الرياضية، وما إلى ذلك. يتم توزيع الموضوعات بالتساوي، مما يعكس تمامًا خصائص التعبير وكثافة المصطلحات في سياق التدريس والشرح الحقيقي.
- إنتاج عروض شرائح عالية الجودةيصمم خبراء المجال المحتوى ويشاركون في التعليقات التوضيحية لضمان دقة واحترافية معلومات النص والصور المعروضة. يتميز محتوى العرض التقديمي بهيكلية واضحة وتصميم جميل، ويحتوي على صور غنية ومعلومات بصرية دلالية، بدلاً من مجرد كومة من النصوص.
- تسجيل فيديو عالي الجودة:يتم تسجيل الفيديو بواسطة متحدث محترف في بيئة هادئة مع صور عالية الدقة، وتغطي وضعين: فيديو قراءة الشفاه (720 بكسل) وفيديو الشريحة (1080 بكسل)، مما يضمن محاذاة دقيقة للكلام وحركات الشفاه، ويضمن جودة البيانات المتسقة والموثوقة.
