HyperAI

اختيارات المحرر الأسبوعية | مجموعة بيانات COIG-CQIA متاحة عبر الإنترنت، وسير عمل ComfyUI Wenshengtu يعمل عبر الإنترنت

特色图像

من أجل سد الفجوة في مجموعات البيانات الصينية عالية الجودة، قامت 10 مؤسسات بما في ذلك الأكاديمية الصينية للعلوم، ومؤسسة Zero One Everything، وجامعة بكين بتطوير مجموعة بيانات COIG-CQIA بشكل مشترك. من المدهش،إن جودة البيانات الخاصة بـ "Retarded Post Bar" في مجموعة البيانات هذه أعلى بكثير من جودة البيانات الخاصة بمجتمعات المعرفة مثل Zhihu و Douban و Sifou. مجموعة بيانات COIG-CQIA متاحة الآن على موقع hyper.ai. تعالوا وألقوا نظرة!

من 8 أبريل إلى 12 أبريل، تحديثات الموقع الرسمي لـhyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* دروس تعليمية مختارة عالية الجودة: 2

* اختيار المقالات المجتمعية: 5 مقالات

* إدخالات الموسوعة الشعبية: 5

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات ضبط التعليمات الصينية عالية الجودة COIG-CQIA

COIG-CQIA تعني أخصائي التعليم المفتوح الصيني العام - الجودة هي كل ما تحتاجه. إنها مجموعة بيانات مفتوحة المصدر لضبط التعليمات عالية الجودة تهدف إلى تزويد مجتمع معالجة اللغة الطبيعية الصيني ببيانات ضبط تعليمات عالية الجودة تتوافق مع سلوك التفاعل البشري.

الاستخدام المباشر:https://go.hyper.ai/Pg37L

2. مجموعة بيانات تعلم المهارات متعددة المنظورات من EgoExoLearn

تحتوي مجموعة بيانات EgoExoLearn على 120 ساعة من بيانات الفيديو التي تم جمعها من مشاهد الحياة اليومية والمختبرات المهنية. لا تتضمن مقاطع الفيديو الموجودة في مجموعة البيانات مقاطع فيديو توضيحية فحسب، بل تتضمن أيضًا مقاطع فيديو سجلها المؤدي باستخدام منظور الشخص الأول الخاص به (الأنا) بعد مشاهدة العرض التوضيحي.

الاستخدام المباشر:https://go.hyper.ai/cYsPM

3. مجموعة بيانات محاكاة الإدراك التعاوني للسفن S2S-SIM

مجموعة بيانات S2S-Sim هي أول مجموعة بيانات لمحاكاة الإدراك التعاوني للسفن تم تطويرها بواسطة جامعة شنغهاي. تحتوي مجموعة البيانات على إجمالي 7000 إطار من البيانات، مع 96881 تعليقًا دقيقًا لمربعات حدود السفينة. ويهدف المشروع إلى دعم الإدراك التعاوني الفعال بين السفن، مع التركيز بشكل خاص على الأبحاث في مجال الإدراك التعاوني بين أنظمة القيادة الذاتية والسفن. 

الاستخدام المباشر: https://go.hyper.ai/AVWp2

4. مجموعة بيانات المجال العام الصينية المشتركة Corpus-zh

تم إنشاء Common Corpus بشكل مشترك من قبل Pleias وHuggingFace ومؤسسات أخرى. وهي حاليًا أكبر مجموعة بيانات متاحة للمجال العام مخصصة خصيصًا لتدريب نماذج اللغة الكبيرة (LLMs). تجمع مجموعة البيانات 500 مليار كلمة من مشاريع التراث الثقافي المتنوعة في جميع أنحاء العالم، بما في ذلك اللغة الإنجليزية والفرنسية والصينية والإسبانية والألمانية والإيطالية ولغات أخرى، مما يجعلها مكتبة الموارد اللغوية الأكثر شمولاً حتى الآن.

الاستخدام المباشر: https://go.hyper.ai/hvuV5

5. TriviaQA مجموعة بيانات كبيرة لفهم القراءة والإجابة على الأسئلة

TriviaQA عبارة عن مجموعة بيانات لفهم القراءة تحتوي على أكثر من 650,000 ثلاثية من الأسئلة والأجوبة. يتضمن TriviaQA 95 ألف زوج من الأسئلة والأجوبة من 662 ألف مستند من ويكيبيديا والويب.

الاستخدام المباشر: https://go.hyper.ai/aant8

6. مجموعة بيانات تقييم الهلوسة النموذجية الصينية الكبيرة HalluQA

تحتوي مجموعة بيانات HalluQA على 450 سؤالاً تنافسيًا تغطي مجالات متعددة وتتعلق بالتاريخ والثقافة والعادات والظواهر الاجتماعية الصينية.

الاستخدام المباشر: https://go.hyper.ai/pWyqe

7. مجموعات بيانات تحليل الفيضانات والتنبؤ بها التي تم إنشاؤها بواسطة نماذج الذكاء الاصطناعي

تمثل مجموعة البيانات هذه بيانات البحث الخاصة بالورقة البحثية "التنبؤ العالمي بالفيضانات الشديدة في مستجمعات المياه غير المقاسة". المحتوى الرئيسي هو بيانات إعادة تحليل الفيضانات (1984-2021) وإعادة التنبؤ (2014-2021) التي تم إنشاؤها بواسطة نموذج الذكاء الاصطناعي وبيانات GloFAS المرجعية المقابلة.

الاستخدام المباشر: https://go.hyper.ai/bpsG3

8. مجموعة بيانات المشهد الكبير متعدد الوسائط MASSTAR

MASSTAR هي مجموعة بيانات مشهدية واسعة النطاق ومتعددة الوسائط تم اقتراحها بشكل مشترك من قبل جامعة صن يات صن وجامعة هونج كونج للعلوم والتكنولوجيا ومؤسسات أخرى. يحتوي على أكثر من 1000 نموذج شبكي ثلاثي الأبعاد على مستوى المشهد، بعضها من العالم الحقيقي.

الاستخدام المباشر:https://go.hyper.ai/eLZUy

9. مجموعة بيانات التعرف على إجراءات فيديو كرة الريشة VideoBadminton

VideoBadminton عبارة عن مجموعة بيانات فيديو عالية الجودة للريشة الطائرة تم إنشاؤها بواسطة جامعة أوبورن والجامعة المركزية الوطنية. تحتوي مجموعة البيانات على بيانات فيديو تنس الريشة لـ 19 رياضيًا ورياضية من فريق الجامعة المركزية الوطنية، وتغطي 18 حركة تنس الريشة، وإجمالي 7822 مقطع فيديو، ومدة إجمالية تبلغ 145 دقيقة.

الاستخدام المباشر:https://go.hyper.ai/w5ToD

10. FineFake: مجموعة بيانات دقيقة متعددة المجالات للكشف عن الأخبار الكاذبة

FineFake هي مجموعة بيانات للكشف عن الأخبار المزيفة متعددة المجالات بدقة، تم إنشاؤها بشكل مشترك من قبل جامعة بيهانغ وجامعة بكين للبريد والاتصالات. تحتوي مجموعة البيانات على إجمالي 16,909 عينة بيانات، تغطي 6 موضوعات دلالية و8 منصات مختلفة. تحتوي كل عينة إخبارية على أشكال متعددة من المحتوى، بما في ذلك النصوص والصور ومعلومات السياق الاجتماعي المحتملة.

الاستخدام المباشر:https://go.hyper.ai/CNWIn

لمزيد من مجموعات البيانات العامة، يرجى زيارة:

https://hyper.ai/datasets

دروس تعليمية عامة مختارة

1. يمكن تخفيض التكلفة بما يصل إلى 16 مرة. أصبح البرنامج التعليمي ComfyUI Stable Cascade متاحًا الآن عبر الإنترنت ويمكن نشره بنقرة واحدة!

يعد هذا البرنامج التعليمي بمثابة برنامج تعليمي حول كيفية استخدام سير عمل ComfyUI Stable Casecade للرسم بالذكاء الاصطناعي. لقد أنشأ البرنامج التعليمي بيئة جيدة ودمج سير عمل الصورة النصية الافتراضية Stable Cascade. يقوم بربط العقد بشكل مباشر لتبسيط عملية الاستخدام ويمكنه إنتاج صورة في ثانيتين.

تشغيل عبر الإنترنت:https://go.hyper.ai/lJGLF

2. برنامج تعليمي لتصنيف صور أمراض المحاصيل

يتناول هذا البرنامج التعليمي استخدام PyTorch لتصنيف صور أمراض المحاصيل، مما يساعد على تدريب نماذج التعلم الآلي للكشف عن أمراض النبات أو تطوير خوارزمية التعلم التلقائي لتشخيص النبات.

تشغيل عبر الإنترنت:https://go.hyper.ai/

مقالات المجتمع

1. مجموعة من موارد النماذج الضخمة جدًا | 30 مجموعة بيانات ونماذج معالجة اللغة الطبيعية عالية الجودة، و8 عروض توضيحية للاستخدام بنقرة واحدة، يوصى بجمعها!

تلخص هذه المقالة الموارد المتعلقة بالنماذج الكبيرة، بما في ذلك 15 مجموعة بيانات و15 نموذجًا و8 عروض توضيحية للنماذج الكبيرة، مع روابط التنزيل والاستخدام.

شاهد المقال كاملا:https://go.hyper.ai/sYC6h

2. التعرف بشكل فعال على 630 ألف تكوين مكاني ثلاثي الأبعاد، قادت جامعة تسينغهوا إصدار نموذج Uni-MOF للتنبؤ بسعة امتصاص MOF

تولى فريق البروفيسور لو ديانان من قسم الهندسة الكيميائية في جامعة تسينغهوا زمام المبادرة في اقتراح نموذج التعلم الآلي Uni-MOF للتنبؤ بسلوك الامتصاص لمواد MOF ثلاثية الأبعاد. لا يستطيع هذا النموذج تحديد واستعادة البنية ثلاثية الأبعاد للمواد النانوية من خلال التدريب المسبق فحسب، بل يمكنه أيضًا النظر بشكل أكبر في ظروف التشغيل مثل درجة الحرارة والضغط وجزيئات الغاز المختلفة. فهو مناسب للبحث العلمي والتطبيقات العملية. وقد نشرت النتائج ذات الصلة في مجلة "نيتشر".

شاهد التقرير الكامل:https://go.hyper.ai/VWFVo

3. يمكن التعرف على سرطان المبيض من خلال فحوصات الدم الروتينية وفحوصات البول وغيرها من المؤشرات! تولى فريق ليو جيهونغ من جامعة صن يات صن زمام المبادرة وقامت أربع كليات طبية كبرى ببناء نموذج اندماج الذكاء الاصطناعي بشكل مشترك

قامت جامعة صن يات صن وجامعة الطب الجنوبية وجامعة هواتشونغ للعلوم والتكنولوجيا وجامعة تشجيانغ ببناء نموذج اندماج الذكاء الاصطناعي MCF لتشخيص سرطان المبيض، والذي يمكنه حساب خطر الإصابة بسرطان المبيض عن طريق إدخال بيانات الاختبارات المعملية الروتينية والعمر. دقة النموذج أفضل من المؤشرات الحيوية التقليدية مثل CA125 وHE4. وقد نُشرت النتائج ذات الصلة في مجلة The Lancet Digital Health.

شاهد التقرير الكامل:https://go.hyper.ai/prEbC

4. نظرة ثاقبة على Insilico: القفزة والمعضلة والاختراق لشركة الأدوية الرائدة في مجال الذكاء الاصطناعي

فشلت شركة إنسيليكون فالي سيليكون، التي جمعت 407.5 مليون دولار أمريكي، في الإدراج في بورصة هونغ كونغ في يناير/كانون الثاني من هذا العام، وقدّمت طلب الإدراج للمرة الثانية في 27 مارس/آذار. وفي خضمّ المنافسة التكنولوجية بين الصين والولايات المتحدة، تضاعفت الضغوط على الشركة بسبب وضعها كشركة ناشئة أمريكية، ورئيس تنفيذي مشارك صيني، ومساهمين أمريكيين، ومقرّ رئيسي صيني... ويبقى أن نرى كيف يمكن الخروج من هذا المأزق وما إذا كان من الممكن أن يصبح بنجاح "أول سهم صيدلاني للذكاء الاصطناعي". تقدم هذه المقالة مقدمة متعمقة لهذه الشركة النجمية في مجال الأدوية القائمة على الذكاء الاصطناعي من جوانب التطوير التكنولوجي وتكوين الفريق وتطوير الأعمال.

شاهد التقرير الكامل:https://go.hyper.ai/llREq

مقالات موسوعية شعبية

1. سلسلة لانج

2. نموذج مزيج الخبراء وزارة التعليم

3. مجموعة استعلام الاهتمام GQA

4. اندماج الترتيب المتبادل RRF

5. معدل الاسترجاع

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://hyper.ai/wiki

معاينة البث المباشر لمحطة B

تاريخوقتمحتوى
الاثنين 15 أبريل10:00مؤتمرات Google IO على مر السنين
الثلاثاء 16 أبريل10:00دورة التعلم العميق من معهد ماساتشوستس للتكنولوجيا 2020
الأربعاء 17 أبريل10:00دورة التعلم العميق من معهد ماساتشوستس للتكنولوجيا 2021
الخميس 18 أبريل10:00دورة شاملة للمبتدئين في تطوير API باستخدام Python
الجمعة 19 أبريل10:00دورات Flutter للمبتدئين
السبت 20 أبريل10:00دورة الذكاء الاصطناعي بايثون CS50 من هارفارد
الأحد 21 أبريل10:00ندوة ستانفورد للذكاء الاصطناعي

تبث قناة Super Neuro TV بثًا مباشرًا على مدار 24 ساعة طوال أيام الأسبوع. انقر للحصول على "المخللات الإلكترونية" في مجال الذكاء الاصطناعي:

http://live.bilibili.com/26483094

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة

* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 100 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai