اختيارات المحرر الأسبوعية | تم إطلاق سلسلة بيانات Hillshell Voice، ويقوم علماء صينيون ببناء نظام MIRS لتقييم تشخيص سرطان الثدي

🏮خلال مهرجان الربيع، نسافر آلاف الأميال لنلتقي بعائلاتنا
🏮الألعاب النارية على الأرض، أجواء رأس السنة الجديدة القوية، والمرح العائلي
وداعا للأرنب اليشم ومرحبا بالربيع مع التنين الذهبي. غدا ليلة رأس السنة!تتمنى شركة HyperAI للجميع عامًا صينيًا جديدًا سعيدًا مقدمًا ~ أتمنى لكم جميعًا عامًا صينيًا جديدًا سعيدًا!أطلق الموقع الرسمي لـ hyper.ai هذا الأسبوع قاعدة بيانات الكلام الصينية مفتوحة المصدر والتي تحتوي على آلاف الساعات التي أنشأها Hill Beike، مما يفتح الباب أمام صوتك.
من 5 فبراير إلى 8 فبراير، تحديثات الموقع الرسمي لـhyper.ai:
* مجموعات البيانات العامة عالية الجودة: 8
* حافظات ورق AI4S: 2
* إدخالات الموسوعة الشعبية: 8
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. قاعدة بيانات AISHELL-1 مفتوحة المصدر للكلام الصيني
تم تسجيل مجموعة البيانات من قبل 400 شخص من مناطق مختلفة من الصين بلهجات مختلفة. بعد أن تم نسخها وتعليقها بواسطة مصححي الصوت المحترفين واجتياز فحص الجودة الصارم، فإن دقة النص في هذه القاعدة البيانات أعلى من 95%. يتم تقسيمها إلى مجموعة التدريب ومجموعة التطوير ومجموعة الاختبار.
الاستخدام المباشر:
https://hyper.ai/datasets/29344
2. قاعدة بيانات الكلام الصينية AISHELL-2
تحتوي قاعدة بيانات AISHELL-2 للكلام الصيني الماندرين على 1000 ساعة من الكلام. وتغطي النصوص المسجلة 12 مجالًا بما في ذلك كلمات الاستيقاظ، وكلمات التحكم الصوتي، والمنزل الذكي، والقيادة بدون طيار، والإنتاج الصناعي.
الاستخدام المباشر:
https://hyper.ai/datasets/29347
3. قاعدة بيانات AISHELL-3 للكلام الصيني عالي الدقة
تم تسجيل مجموعة البيانات من قبل 218 شخصًا من مناطق لهجة مختلفة في الصين. قام المصححون الصوتيون المحترفون بوضع علامات على البينين والإيقاع، واجتازوا عمليات تفتيش صارمة للجودة. الدقة الصوتية لهذه القاعدة البيانات أعلى من 98%.
الاستخدام المباشر:
https://hyper.ai/datasets/29352
4. قاعدة بيانات AISHELL-4 متعددة القنوات لخطابات المؤتمرات الصينية
يتكون مؤتمر AISHELL-4 من 211 جلسة مؤتمر مسجلة، كل منها تضم من 4 إلى 8 متحدثين، بإجمالي مدة 120 ساعة، والتي يمكن استخدامها لمهام فردية مثل معالجة الواجهة الأمامية للكلام والتعرف على الكلام.
الاستخدام المباشر:
https://hyper.ai/datasets/29375
5. قاعدة بيانات AISHELL-WakeUp-1 الصوتية لكلمات الاستيقاظ باللغتين الصينية والإنجليزية
دعت هذه المجموعة من البيانات 254 متحدثًا للمشاركة في التسجيل، بإجمالي ما يقرب من 4 ملايين صوت لكلمات الاستيقاظ و1561.12 ساعة. نص التسجيل هو "مرحبا ميا"، "مرحبا ميا" كلمة الاستيقاظ. لقد تم نسخ هذه القاعدة البيانات وتعليقها من قبل مصححي الكلام المحترفين، كما اجتازت عمليات تفتيش صارمة للجودة. يمكن استخدامه في الأبحاث مثل التعرف على بصمة الصوت والتعرف على الاستيقاظ الصوتي.
الاستخدام المباشر:
https://hyper.ai/datasets/29186
6. قاعدة بيانات صوت المشهد الرئيسي لمصفوفة ميكروفون الماندرين الصينية AISHELL-DMASH
تم تسجيل مجموعة بيانات AISHELL-DMASH في سيناريوهات المنزل الذكي الحقيقية في غرفتين مختلفتين وتحتوي على 30000 ساعة من بيانات الكلام. تم نسخ مجموعة البيانات بواسطة معلقين صوتيين محترفين بدقة كلمة تبلغ 98%. يمكن استخدامه في الأبحاث مثل التعرف على بصمة الصوت، والتعرف على الكلام، والتعرف على الكلمات عند الاستيقاظ.
الاستخدام المباشر:
https://hyper.ai/datasets/29380
7.مجموعة بيانات شبكة الرموز العميقة DeepSymNet
هذه شبكة رمزية جديدة تسمى DeepSymNet اقترحها باحثون من معهد أشباه الموصلات التابع للأكاديمية الصينية للعلوم، لتمثيل التعبيرات الرمزية واستخدامها في الانحدار الرمزي.
الاستخدام المباشر:
https://hyper.ai/datasets/29321
8. مجموعة بيانات نصية باللغة الصينية GPT4 من Evol Instruct
تم إنشاء مجموعة البيانات هذه بالطريقة التالية:
(1) ترجمة الأسئلة الإنجليزية الخاصة بـ Evol-instruct-70k إلى اللغة الصينية؛
(2) اطلب من GPT4 إنشاء إجابات باللغة الصينية.
الاستخدام المباشر:
https://hyper.ai/datasets/29318
العلوم والذكاء الاصطناعي دراسات حالة مختارة
في الآونة الأخيرة، استخدم علماء صينيون نموذج الشبكة العصبية لإنشاء نظام تسجيل MIRS للتنبؤ بتشخيص وعلاج سرطان الثدي، والذي يمكن استخدامه لتوجيه صياغة استراتيجيات العلاج لمرضى سرطان الثدي. وقد تم نشر أوراق ذات صلة فيآي ساينس"مجلة.
شاهد التقرير الكامل:
إن أبحاث سلوك الحيوان تحتاج بشكل عاجل إلى تحسين كفاءة البحث ودقته من خلال الابتكار التكنولوجي. وبناءً على ذلك، ظهر أطلس السلوك الاجتماعي (SBeA). تم تطويره من قبل معهد شنتشن للتكنولوجيا المتقدمة التابع للأكاديمية الصينية للعلوم، ويمكنه قياس سلوك الحيوانات الحرة بشكل شامل وإجراء رسم خرائط ثلاثية الأبعاد متعددة الحيوانات باستخدام عدد صغير من الإطارات المسمى (حوالي 400 إطار).تقدير الوضعيةمن خلال استراتيجية التعلم بالنقل ثنائي الاتجاه، فإن دقة التعرف على هوية الحيوانات المتعددة تتجاوز 90%. وقد نشرت النتائج ذات الصلة في مجلة "نيتشر".
شاهد التقرير الكامل:
مقالات موسوعية شعبية
1. عمليات النقطة العائمة في الثانية فشل
2. المشي العشوائي
3. الفحص الافتراضي
4. استرجاع المعلومات الموسيقية (MIR)
5. الشبكة العصبية الكمومية
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد ترغب في تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
مع اقتراب العام الصيني الجديد، تتمنى HyperAI مرة أخرى للجميع حظًا سعيدًا وازدهارًا وحياة سعيدة ومُرضية!في العام الجديد، سنقدم لكم المزيد من المفاجآت!
نراكم في عام التنين!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة
* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: