اختيارات المحرر الأسبوعية | مجموعة بيانات COIG-CQIA متاحة عبر الإنترنت، وسير عمل ComfyUI Wenshengtu يعمل عبر الإنترنت

من أجل سد الفجوة في مجموعات البيانات الصينية عالية الجودة، قامت 10 مؤسسات بما في ذلك الأكاديمية الصينية للعلوم، ومؤسسة Zero One Everything، وجامعة بكين بتطوير مجموعة بيانات COIG-CQIA بشكل مشترك. من المدهش،إن جودة البيانات الخاصة بـ "Retarded Post Bar" في مجموعة البيانات هذه أعلى بكثير من جودة البيانات الخاصة بمجتمعات المعرفة مثل Zhihu و Douban و Sifou. مجموعة بيانات COIG-CQIA متاحة الآن على موقع hyper.ai. تعالوا وألقوا نظرة!
من 8 أبريل إلى 12 أبريل، تحديثات الموقع الرسمي لـhyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* دروس تعليمية مختارة عالية الجودة: 2
* اختيار المقالات المجتمعية: 5 مقالات
* إدخالات الموسوعة الشعبية: 5
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات ضبط التعليمات الصينية عالية الجودة COIG-CQIA
COIG-CQIA تعني أخصائي التعليم المفتوح الصيني العام - الجودة هي كل ما تحتاجه. إنها مجموعة بيانات مفتوحة المصدر لضبط التعليمات عالية الجودة تهدف إلى تزويد مجتمع معالجة اللغة الطبيعية الصيني ببيانات ضبط تعليمات عالية الجودة تتوافق مع سلوك التفاعل البشري.
الاستخدام المباشر:https://go.hyper.ai/Pg37L
2. مجموعة بيانات تعلم المهارات متعددة المنظورات من EgoExoLearn
تحتوي مجموعة بيانات EgoExoLearn على 120 ساعة من بيانات الفيديو التي تم جمعها من مشاهد الحياة اليومية والمختبرات المهنية. لا تتضمن مقاطع الفيديو الموجودة في مجموعة البيانات مقاطع فيديو توضيحية فحسب، بل تتضمن أيضًا مقاطع فيديو سجلها المؤدي باستخدام منظور الشخص الأول الخاص به (الأنا) بعد مشاهدة العرض التوضيحي.
الاستخدام المباشر:https://go.hyper.ai/cYsPM
3. مجموعة بيانات محاكاة الإدراك التعاوني للسفن S2S-SIM
مجموعة بيانات S2S-Sim هي أول مجموعة بيانات لمحاكاة الإدراك التعاوني للسفن تم تطويرها بواسطة جامعة شنغهاي. تحتوي مجموعة البيانات على إجمالي 7000 إطار من البيانات، مع 96881 تعليقًا دقيقًا لمربعات حدود السفينة. ويهدف المشروع إلى دعم الإدراك التعاوني الفعال بين السفن، مع التركيز بشكل خاص على الأبحاث في مجال الإدراك التعاوني بين أنظمة القيادة الذاتية والسفن.
الاستخدام المباشر: https://go.hyper.ai/AVWp2
4. مجموعة بيانات المجال العام الصينية المشتركة Corpus-zh
تم إنشاء Common Corpus بشكل مشترك من قبل Pleias وHuggingFace ومؤسسات أخرى. وهي حاليًا أكبر مجموعة بيانات متاحة للمجال العام مخصصة خصيصًا لتدريب نماذج اللغة الكبيرة (LLMs). تجمع مجموعة البيانات 500 مليار كلمة من مشاريع التراث الثقافي المتنوعة في جميع أنحاء العالم، بما في ذلك اللغة الإنجليزية والفرنسية والصينية والإسبانية والألمانية والإيطالية ولغات أخرى، مما يجعلها مكتبة الموارد اللغوية الأكثر شمولاً حتى الآن.
الاستخدام المباشر: https://go.hyper.ai/hvuV5
5. TriviaQA مجموعة بيانات كبيرة لفهم القراءة والإجابة على الأسئلة
TriviaQA عبارة عن مجموعة بيانات لفهم القراءة تحتوي على أكثر من 650,000 ثلاثية من الأسئلة والأجوبة. يتضمن TriviaQA 95 ألف زوج من الأسئلة والأجوبة من 662 ألف مستند من ويكيبيديا والويب.
الاستخدام المباشر: https://go.hyper.ai/aant8
6. مجموعة بيانات تقييم الهلوسة النموذجية الصينية الكبيرة HalluQA
تحتوي مجموعة بيانات HalluQA على 450 سؤالاً تنافسيًا تغطي مجالات متعددة وتتعلق بالتاريخ والثقافة والعادات والظواهر الاجتماعية الصينية.
الاستخدام المباشر: https://go.hyper.ai/pWyqe
7. مجموعات بيانات تحليل الفيضانات والتنبؤ بها التي تم إنشاؤها بواسطة نماذج الذكاء الاصطناعي
تمثل مجموعة البيانات هذه بيانات البحث الخاصة بالورقة البحثية "التنبؤ العالمي بالفيضانات الشديدة في مستجمعات المياه غير المقاسة". المحتوى الرئيسي هو بيانات إعادة تحليل الفيضانات (1984-2021) وإعادة التنبؤ (2014-2021) التي تم إنشاؤها بواسطة نموذج الذكاء الاصطناعي وبيانات GloFAS المرجعية المقابلة.
الاستخدام المباشر: https://go.hyper.ai/bpsG3
8. مجموعة بيانات المشهد الكبير متعدد الوسائط MASSTAR
MASSTAR هي مجموعة بيانات مشهدية واسعة النطاق ومتعددة الوسائط تم اقتراحها بشكل مشترك من قبل جامعة صن يات صن وجامعة هونج كونج للعلوم والتكنولوجيا ومؤسسات أخرى. يحتوي على أكثر من 1000 نموذج شبكي ثلاثي الأبعاد على مستوى المشهد، بعضها من العالم الحقيقي.
الاستخدام المباشر:https://go.hyper.ai/eLZUy
9. مجموعة بيانات التعرف على إجراءات فيديو كرة الريشة VideoBadminton
VideoBadminton عبارة عن مجموعة بيانات فيديو عالية الجودة للريشة الطائرة تم إنشاؤها بواسطة جامعة أوبورن والجامعة المركزية الوطنية. تحتوي مجموعة البيانات على بيانات فيديو تنس الريشة لـ 19 رياضيًا ورياضية من فريق الجامعة المركزية الوطنية، وتغطي 18 حركة تنس الريشة، وإجمالي 7822 مقطع فيديو، ومدة إجمالية تبلغ 145 دقيقة.
الاستخدام المباشر:https://go.hyper.ai/w5ToD
10. FineFake: مجموعة بيانات دقيقة متعددة المجالات للكشف عن الأخبار الكاذبة
FineFake هي مجموعة بيانات للكشف عن الأخبار المزيفة متعددة المجالات بدقة، تم إنشاؤها بشكل مشترك من قبل جامعة بيهانغ وجامعة بكين للبريد والاتصالات. تحتوي مجموعة البيانات على إجمالي 16,909 عينة بيانات، تغطي 6 موضوعات دلالية و8 منصات مختلفة. تحتوي كل عينة إخبارية على أشكال متعددة من المحتوى، بما في ذلك النصوص والصور ومعلومات السياق الاجتماعي المحتملة.
الاستخدام المباشر:https://go.hyper.ai/CNWIn
لمزيد من مجموعات البيانات العامة، يرجى زيارة:
دروس تعليمية عامة مختارة
يعد هذا البرنامج التعليمي بمثابة برنامج تعليمي حول كيفية استخدام سير عمل ComfyUI Stable Casecade للرسم بالذكاء الاصطناعي. لقد أنشأ البرنامج التعليمي بيئة جيدة ودمج سير عمل الصورة النصية الافتراضية Stable Cascade. يقوم بربط العقد بشكل مباشر لتبسيط عملية الاستخدام ويمكنه إنتاج صورة في ثانيتين.
تشغيل عبر الإنترنت:https://go.hyper.ai/lJGLF
2. برنامج تعليمي لتصنيف صور أمراض المحاصيل
يتناول هذا البرنامج التعليمي استخدام PyTorch لتصنيف صور أمراض المحاصيل، مما يساعد على تدريب نماذج التعلم الآلي للكشف عن أمراض النبات أو تطوير خوارزمية التعلم التلقائي لتشخيص النبات.
تشغيل عبر الإنترنت:https://go.hyper.ai/
مقالات المجتمع
تلخص هذه المقالة الموارد المتعلقة بالنماذج الكبيرة، بما في ذلك 15 مجموعة بيانات و15 نموذجًا و8 عروض توضيحية للنماذج الكبيرة، مع روابط التنزيل والاستخدام.
شاهد المقال كاملا:https://go.hyper.ai/sYC6h
تولى فريق البروفيسور لو ديانان من قسم الهندسة الكيميائية في جامعة تسينغهوا زمام المبادرة في اقتراح نموذج التعلم الآلي Uni-MOF للتنبؤ بسلوك الامتصاص لمواد MOF ثلاثية الأبعاد. لا يستطيع هذا النموذج تحديد واستعادة البنية ثلاثية الأبعاد للمواد النانوية من خلال التدريب المسبق فحسب، بل يمكنه أيضًا النظر بشكل أكبر في ظروف التشغيل مثل درجة الحرارة والضغط وجزيئات الغاز المختلفة. فهو مناسب للبحث العلمي والتطبيقات العملية. وقد نشرت النتائج ذات الصلة في مجلة "نيتشر".
شاهد التقرير الكامل:https://go.hyper.ai/VWFVo
قامت جامعة صن يات صن وجامعة الطب الجنوبية وجامعة هواتشونغ للعلوم والتكنولوجيا وجامعة تشجيانغ ببناء نموذج اندماج الذكاء الاصطناعي MCF لتشخيص سرطان المبيض، والذي يمكنه حساب خطر الإصابة بسرطان المبيض عن طريق إدخال بيانات الاختبارات المعملية الروتينية والعمر. دقة النموذج أفضل من المؤشرات الحيوية التقليدية مثل CA125 وHE4. وقد نُشرت النتائج ذات الصلة في مجلة The Lancet Digital Health.
شاهد التقرير الكامل:https://go.hyper.ai/prEbC
4. نظرة ثاقبة على Insilico: القفزة والمعضلة والاختراق لشركة الأدوية الرائدة في مجال الذكاء الاصطناعي
فشلت شركة إنسيليكون فالي سيليكون، التي جمعت 407.5 مليون دولار أمريكي، في الإدراج في بورصة هونغ كونغ في يناير/كانون الثاني من هذا العام، وقدّمت طلب الإدراج للمرة الثانية في 27 مارس/آذار. وفي خضمّ المنافسة التكنولوجية بين الصين والولايات المتحدة، تضاعفت الضغوط على الشركة بسبب وضعها كشركة ناشئة أمريكية، ورئيس تنفيذي مشارك صيني، ومساهمين أمريكيين، ومقرّ رئيسي صيني... ويبقى أن نرى كيف يمكن الخروج من هذا المأزق وما إذا كان من الممكن أن يصبح بنجاح "أول سهم صيدلاني للذكاء الاصطناعي". تقدم هذه المقالة مقدمة متعمقة لهذه الشركة النجمية في مجال الأدوية القائمة على الذكاء الاصطناعي من جوانب التطوير التكنولوجي وتكوين الفريق وتطوير الأعمال.
شاهد التقرير الكامل:https://go.hyper.ai/llREq
مقالات موسوعية شعبية
1. سلسلة لانج
2. نموذج مزيج الخبراء وزارة التعليم
3. مجموعة استعلام الاهتمام GQA
4. اندماج الترتيب المتبادل RRF
5. معدل الاسترجاع
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
معاينة البث المباشر لمحطة B
تاريخ | وقت | محتوى |
الاثنين 15 أبريل | 10:00 | مؤتمرات Google IO على مر السنين |
الثلاثاء 16 أبريل | 10:00 | دورة التعلم العميق من معهد ماساتشوستس للتكنولوجيا 2020 |
الأربعاء 17 أبريل | 10:00 | دورة التعلم العميق من معهد ماساتشوستس للتكنولوجيا 2021 |
الخميس 18 أبريل | 10:00 | دورة شاملة للمبتدئين في تطوير API باستخدام Python |
الجمعة 19 أبريل | 10:00 | دورات Flutter للمبتدئين |
السبت 20 أبريل | 10:00 | دورة الذكاء الاصطناعي بايثون CS50 من هارفارد |
الأحد 21 أبريل | 10:00 | ندوة ستانفورد للذكاء الاصطناعي |
تبث قناة Super Neuro TV بثًا مباشرًا على مدار 24 ساعة طوال أيام الأسبوع. انقر للحصول على "المخللات الإلكترونية" في مجال الذكاء الاصطناعي:
http://live.bilibili.com/26483094
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة
* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: