اختيارات المحرر الأسبوعية | مجموعة بيانات الموسيقى CCMusic متاحة على الإنترنت، وتكشف عن نموذج ChipNeMo الكبير الذي طورته NVIDIA ذاتيًا

من أجل جعل الذكاء الاصطناعي أكثر كفاءة في التدريب الموسيقي،فتحت CCMusic بعض مجموعات البيانات الموسيقية والصوتية للاستخدام المجاني من قبل باحثي علم الموسيقى الحاسوبي.متاح الآن على hyper.ai. بالإضافة إلى ذلك، قامت hyper.ai أيضًا بتحديث مجموعات البيانات الموسيقية ذات الصلة مثل miHoYo وNetEase Cloud Music. دعونا نلقي نظرة!
من 22 يناير إلى 26 يناير، تم تحديث الموقع الرسمي لـ hyper.ai بسرعة:
* مجموعات البيانات العامة عالية الجودة: 10
* حافظات ورق AI4S: 2
* إدخالات الموسوعة الشعبية: 10
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات الأصوات الحقيقية والخاطئة من CCMUSIC
تحتوي مجموعة البيانات هذه على 1280 صوتًا غنائيًا أحادي الصوت (بتنسيق .wav) بصوت الصدر والصوت الفالسيتو. يتم تمييز صوت الصدر على أنه صوت صدر ويتم تمييز الصوت العالي على أنه صوت عالي.
الاستخدام المباشر:
https://hyper.ai/datasets/29125
2. مجموعة بيانات جودة صوت البيانو CCMUSIC
تحتوي مجموعة البيانات هذه على 12 ملف صوتي متعدد النطاقات (بتنسيق .wav / .mp3 / .m4a) و 1320 ملف صوتي أحادي النغمة مجزأ (بتنسيق .wav / .mp3 / .m4a) من 7 أنواع من البيانو في غرفة البيانو في المعهد الموسيقي الصيني (بيانو كاواي القائم، بيانو كاواي الكبير، بيانو يونغتشانغ القائم، بيانو شينغهاي القائم، بيانو ستاينواي جراند ثياتر الكبير، بيانو ستاينواي الكبير وبيانو بيرل ريفر القائم)، بإجمالي 1332 ملفًا. بالإضافة إلى ذلك، هناك استبيان تقييم ذاتي لجودة صوت البيانو (تنسيق .xls)، والذي يتضمن درجات 29 مشاركًا في التقييم الذاتي لجودة صوت البيانو.
الاستخدام المباشر:
https://hyper.ai/datasets/29097
3. مجموعة بيانات أنواع الموسيقى CCMUSIC
تحتوي مجموعة البيانات على حوالي 1700 قطعة موسيقية (بتنسيق .mp3)، بطول يتراوح بين 270 و300 ثانية، مقسمة إلى 17 نوعًا موسيقيًا في المجموع. نظرًا لقضايا حقوق الطبع والنشر للموسيقى الأصلية، يتم توفير الطيف فقط في مجموعة البيانات.
الاستخدام المباشر:
https://hyper.ai/datasets/29094
4. مجموعة بيانات الغناء الوطني CCMUSIC Bel Canto
تحتوي مجموعة البيانات هذه على مئات من تسجيلات الأغاني الكابيلا التي غناها مطربون محترفون بأسلوبين: Bel Conto والغناء الشعبي الصيني. يتم غناء جميع المقاطع بواسطة مطربين محترفين وتسجيلها في استوديوهات تسجيل تجارية احترافية.
الاستخدام المباشر:
https://hyper.ai/datasets/29086
5. مجموعة بيانات تصنيف مشاعر الموسيقى السحابية من NetEase
تحتوي مجموعة البيانات على حوالي 395000 من بيانات ملصق عاطفة الموسيقى، يتكون كل منها من ثلاثة أعمدة رئيسية: معرف الأغنية، ومعرف قائمة التشغيل، وملصق عاطفة الأغنية. المصدر لهذه البيانات هو الموقع الرسمي لـ NetEase Cloud Music، والذي يوفر معلومات مفصلة حول وضع علامات على مشاعر الأغاني. نظرًا للحجم الكبير لمجموعة البيانات، فهي مناسبة لبناء نماذج تحليل المشاعر، وإجراء تعدين البيانات، والحصول على فهم عميق للعلاقة بين الموسيقى والعواطف.
الاستخدام المباشر:
https://hyper.ai/datasets/29133
6. مجموعة بيانات miHoYo Music Remix Piano
تحتوي هذه المجموعة من البيانات بشكل أساسي على مي هويو مقاطع موسيقى البيانو من اثنتين من ألعابها، "Genshin Impact" و"Honkai: Star Rail". لقد تم تحويل مقاطع البيانو هذه إلى تدوين ABC. يمكن للباحثين استخدام هذا المورد لتحليل الميزات الموسيقية بشكل عميق مثل النوتات والبنية اللحنية، مما يوفر دعمًا كبيرًا للبيانات لتدريب وتحسين خوارزميات إنشاء الموسيقى.
الاستخدام المباشر:
https://hyper.ai/datasets/29150
7. مجموعة بيانات تحليل الموسيقى FMA
FMA عبارة عن مجموعة بيانات لتحليل الموسيقى تتكون من الصوت عالي الجودة الكامل والميزات المحسوبة مسبقًا، بالإضافة إلى البيانات الوصفية على مستوى المسار والمستخدم، والتي يمكن استخدامها لتقييم مهام متعددة في MIR (استرجاع معلومات الموسيقى).
الاستخدام المباشر:
https://hyper.ai/datasets/29162
8. مجموعة بيانات الكشف عن خلايا الطحالب عالية الإنتاجية
تأتي مجموعة البيانات هذه من تحدي اكتشاف الكائنات "Vision Meets Algae" في مؤتمر IEEE Network Informatics لعام 2023، بما في ذلك مجموعات التدريب ومجموعات الاختبار. تحتوي مجموعة التدريب على 700 صورة وتحتوي مجموعة الاختبار على 300 صورة، والتي تنقسم إلى 6 فئات. يتم شرح مجموعة التدريب بتنسيق YOLO، وكل صورة لديها ملف شرح .txt مطابق.
الاستخدام المباشر:
https://hyper.ai/datasets/29158
9. مجموعة بيانات الاستدلال الرياضي MathVista
MathVista هو معيار شامل للتفكير الرياضي في بيئة مرئية. وهو يتألف من ثلاث مجموعات بيانات تم إنشاؤها حديثًا، وهي IQTest وFunctionQA وPaperQA، والتي تُستخدم لتقييم التفكير المنطقي على الرسوم البيانية لاختبار الصور المقطوعة، والتفكير الجبري على الرسوم البيانية للوظائف، والتفكير العلمي على الرسوم البيانية للأوراق الأكاديمية، على التوالي. يحتوي MathVista على إجمالي 6,141 مثالًا تم جمعها من 31 مجموعة بيانات مختلفة.
الاستخدام المباشر:
https://hyper.ai/datasets/29122
10. الحيوانات: 10 أنواع من مجموعات بيانات صور الحيوانات
تحتوي مجموعة البيانات على حوالي 28 ألف صورة حيوانية متوسطة الجودة تنتمي إلى 10 فئات: الكلب، القطة، الحصان، العنكبوت، الفراشة، الدجاج، الأغنام، البقرة، السنجاب، الفيل. يمكن استخدامه لاختبار شبكات التعرف على الصور المختلفة.
الاستخدام المباشر:
https://hyper.ai/datasets/29079
العلوم والذكاء الاصطناعي دراسات حالة مختارة
1. الذكاء الاصطناعي يُمكّن التبريد الأخضر، جامعة لينغنان في هونغ كونغ تُطوّر نموذج DEMMFL للتنبؤ بحمل تبريد المباني
اقترح باحثون من جامعة لينجنان وجامعة مدينة هونج كونج نموذجًا جديدًا للتعلم الهندسي متعدد الوسائط الديناميكي (DEMMFL) في "التحدي العالمي للذكاء الاصطناعي لمرافق البناء الميكانيكية والكهربائية" والذي يمكنه التنبؤ بدقة بأحمال تبريد المباني والمساعدة في توفير الطاقة. وقد تم نشر أوراق ذات صلة فيالطاقة التطبيقية"مجلة.
شاهد التقرير الكامل:
2. هل تدحرج نفسك؟ إنفيديا تطلق نموذجًا كبيرًا من ChipNeMo، مخصصًا لتصميم الشريحة
أطلقت شركة Nvidia نموذجًا لغويًا كبيرًا مخصصًا، ChipNeMo، تم تدريبه بناءً على بياناتها الداخلية لمساعدة المهندسين في إكمال المهام المتعلقة بتصميم الشريحة. تعتبر هذه المقالة مقدمة تفصيلية لـ ChipNeMo.
شاهد التقرير الكامل:
مقالات موسوعية شعبية
1. القاعدة النووية
2. اختبار t المقترن
3. الحوسبة الموزعة
4. مزيج من الخبراء (وزارة التعليم)
5. التوليد المعزز بالاسترجاع (RAG)
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:https://hyper.ai/wiki
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد ترغب في تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة
* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:https://hyper.ai/