HyperAI

ترجمة صينية حصرية! بدأت دورة الذكاء الاصطناعي الربيعية لطالب ليكون ألفريدو؛ تنزيل مجموعة بيانات الاستشعار عن بعد CVPR'24

特色图像

أصدر ألفريدو كانزياني، الأستاذ المساعد في علوم الكمبيوتر بجامعة نيويورك وتلميذ يان ليكون، مؤخرًا "دورة الذكاء الاصطناعي" الربيعية، والتي تغطي موضوعات مثل الاحتمالات المنفصلة وبايز الساذج، والمُدْرِكات والانحدار اللوجستي، والتحسين، والإحصاء ومعالجة اللغة الطبيعية العصبية، وتصنيف الشبكات العصبية، والشبكات العصبية المتكررة والشبكات العصبية التلافيفية.
هذا الأسبوع، سوف تقوم HyperAI ببث الدورة التدريبية مباشرة على B Station 24/7. دعونا نتعلم معا~

رابط المشاهدة:

http://live.bilibili.com/26483094

من 24 يونيو إلى 28 يونيو، تحديثات الموقع الرسمي لـhyper.ai:

  • مجموعات البيانات العامة عالية الجودة: 10
  • مجموعة مختارة من الدروس التعليمية عالية الجودة: 3
  • اختيار المقالات المجتمعية: 4 مقالات
  • إدخالات الموسوعة الشعبية: 5
  • أهم المؤتمرات التي لها مواعيد نهائية في يوليو: 4

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات تتبع التعليمات متعددة الوسائط للاستشعار عن بُعد من GeoChat Instruct

تحتوي مجموعة البيانات على ما يقرب من 318000 تعليمة وتهدف إلى توسيع نطاق التكيف مع التعليمات المتعددة الوسائط إلى مجال الاستشعار عن بعد لتدريب المساعدين المحادثة متعددي المهام. وقد تم قبول نتائج الورقة ذات الصلة من قبل CVPR 2024.

الاستخدام المباشر:https://go.hyper.ai/CXu0K

2. مجموعة بيانات تجزئة صور الاستشعار عن بعد الكبيرة RRSIS-D

تحتوي مجموعة البيانات على 17,402 ثلاثية من أقنعة وصف الصورة تغطي مجموعة متنوعة من الدقة المكانية واتجاهات الكائنات. وقد تم قبول نتائج الورقة ذات الصلة من قبل CVPR 2024.

الاستخدام المباشر:https://go.hyper.ai/1VRQG

3. مجموعة بيانات محلل الأرض ومجموعة بيانات رسم الخرائط للاستشعار عن بعد

تُستخدم مجموعة البيانات هذه لتدريب وتقييم طرق التحليل على عمليات مسح LiDAR الجوية الكبيرة وغير المنظمة. تحتوي مجموعة البيانات على 7 مشاهد تغطي مساحة تزيد عن 7.7 كيلومتر مربع وإجمالي 98 مليون نقطة ثلاثية الأبعاد. وقد تم قبول نتائج الورقة ذات الصلة من قبل CVPR 2024.

الاستخدام المباشر:https://go.hyper.ai/3pFjm

4. مجموعة بيانات Harvard-GF3300 لأمراض الشبكية العصبية (الجلوكوما)

هذه المجموعة من البيانات هي مجموعة بيانات لأمراض الأعصاب الشبكية (الجلوكوما) تتضمن 3300 موضوعًا، وتحتوي على بيانات صور ثنائية وثلاثية الأبعاد. تحتوي مجموعة البيانات على عدد متساوٍ من الأشخاص من المجموعات العرقية الرئيسية الثلاث (الأبيض والأسود والآسيوي)، مما يتجنب مشكلات عدم التوازن في البيانات التي قد تخلط بين قضايا التعلم العادل.

الاستخدام المباشر:https://go.hyper.ai/vIhu6

5. صور الأشعة السينية للأسنان للتحليل مجموعة بيانات صور الأشعة السينية للأسنان

تحتوي مجموعة البيانات هذه على صور الأشعة السينية المتنوعة للتصوير المقطعي التقويمي للأسنان (OPG)، و70 عينة عالية الجودة. من خلال توفير التعليقات التوضيحية، يمكن استخدام مجموعة البيانات هذه لتدريب واختبار نماذج التعلم الآلي لمهام تحليل صور الأسنان مثل تصنيف نوع الأسنان، واكتشاف الشذوذ، وما إلى ذلك.

الاستخدام المباشر:https://go.hyper.ai/vK9zz

6. مجموعة بيانات الأشعة السينية للكسور متعددة المناطق

تحتوي مجموعة البيانات على صور أشعة سينية مكسورة وغير مكسورة تغطي جميع مناطق الجسم التشريحية بما في ذلك الأطراف السفلية والأطراف العلوية والعمود الفقري القطني والوركين والركبتين وما إلى ذلك. وتنقسم مجموعة البيانات إلى مجلدات للتدريب والاختبار والتحقق، بإجمالي 10580 بيانات صورة أشعة سينية.

الاستخدام المباشر:https://go.hyper.ai/Yk1bA

7. مجموعة بيانات التعرف على صور الفاكهة والخضروات

تحتوي مجموعة البيانات على صور لـ 10 أنواع من الفواكه و 26 نوعًا من الخضروات، وتنقسم كل فئة إلى مجموعات تدريب واختبار وتحقق، مما يوفر مجموعة متنوعة لمهام التعرف على الصور.

الاستخدام المباشر:https://go.hyper.ai/FdfRK

8. مخطوطة الأحرف

تحتوي مجموعة البيانات على معلومات حول 15,939 شخصية مشهورة من مختلف أنواع الوسائط والأنواع. يتضمن كل إدخال تفاصيل حول الشخصية ومصدر الوسائط ومشهدًا فريدًا يتضمن الشخصية.

الاستخدام المباشر:https://go.hyper.ai/wf1q1

9. RepLiQA عبارة عن مجموعة بيانات محتملة للإجابة على الأسئلة من أجل المقارنة المعيارية

RepLiQA عبارة عن مجموعة بيانات تقييمية تحتوي على ثلاثيات "السياق - السؤال - الإجابة" التي تغطي 17 موضوعًا أو فئة من المستندات، وهي مصممة لاختبار قدرة نماذج اللغة الكبيرة (LLMs) على العثور على المعلومات السياقية واستخدامها في المستندات المقدمة.

الاستخدام المباشر:https://go.hyper.ai/ZkSYD

10. مجموعة بيانات تقييم أمان الشبكة النموذجية الكبيرة CS-Eval

وتغطي مجموعة البيانات 11 مجالًا رئيسيًا لأمن الشبكات، و42 مجالًا فرعيًا، و4369 سؤالًا من متعدد الاختيارات، وأسئلة صواب أو خطأ، وأسئلة استخراج المعرفة. إنه يوفر مهام تقييم شاملة تعتمد على المعرفة والممارسة، ويدعم التقييم الذاتي للمستخدم، ويوفر مرجعًا وإلهامًا لتنفيذ نماذج واسعة النطاق في مجال أمان الشبكات.

الاستخدام المباشر:https://go.hyper.ai/ziacf

لمزيد من مجموعات البيانات العامة، يرجى زيارة:

https://hyper.ai/datasets

دروس تعليمية عامة مختارة

1. عرض توضيحي للتنبؤ الهرمي للتصنيف البيولوجي باستخدام Bioclip

يمكن لهذا العرض التوضيحي التعليمي تصنيف صورة بيولوجية معينة حسب العائلة أو الجنس أو النوع وما إلى ذلك. وهو إصدار Gradio للنموذج الموجود في أفضل ورقة طلابية "BioCLIP: نموذج أساسي لرؤية شجرة الحياة" من CVPR2024.

تشغيل عبر الإنترنت:https://go.hyper.ai/OEWk1
2. InstantStyle - مولد صور متسق

InstantStyle هو إطار عمل لإنشاء نص إلى صورة تم تطويره بواسطة فريق InstantX التابع لـ Xiaohongshu، والذي يحقق نقل الأسلوب مع الحفاظ على إمكانية التحكم في نص المحتوى. لقد قام هذا البرنامج التعليمي ببناء البيئة المناسبة لك، ويمكنك تجربتها بنقرة واحدة!

تشغيل عبر الإنترنت:https://go.hyper.ai/E6GuW

3. قم بإنشاء مقالات عالية الجودة في 5 ثوانٍ، يبدأ Llama 3-Chinese-Chat Demo بنقرة واحدة!

هذا النموذج هو نموذج دردشة صيني يعتمد على نموذج Meta-Llama-3-8b-Instruct الذي تم ضبطه خصيصًا للغة الصينية. وبالمقارنة مع نموذج Meta-Llama-3-8b-Instruct الأصلي، فقد تم تقليل عدد "الأسئلة الصينية مع الردود الإنجليزية" والأسئلة المختلطة باللغتين الصينية والإنجليزية بشكل كبير. كل ما عليك فعله هو استنساخ الحاوية وبدء تشغيلها، ثم نسخ عنوان API الناتج مباشرةً لتجربة الاستدلال على النموذج.

تشغيل عبر الإنترنت:https://go.hyper.ai/BLHcM

مقالات المجتمع

1. ولادة أقوى مغناطيس فائق التوصيل مصنوع من الحديد! علماء يصممون نظام بحث جديد يعتمد على التعلم الآلي، بقوة مجال مغناطيسي أعلى بمقدار 2.7 مرة من الرقم القياسي السابق

استخدم علماء من المملكة المتحدة واليابان تكنولوجيا التعلم الآلي لتصميم نظام بحثي يجمع بين الأساليب التي يقودها الباحثون والأساليب التي تعتمد على البيانات، ونجحوا في إنتاج أقوى مغناطيس فائق التوصيل قائم على الحديد معروف في العالم. هذه المقالة عبارة عن تفسير مفصل ومشاركة للبحث.

عرض تفاصيل الحدث:https://go.hyper.ai/RxV9x

2. لي جيان بينج، نائب رئيس مستشفى جامعة بكين: استخدام الذكاء الاصطناعي لحل الصعوبات والاختناقات ونقاط الضعف في التنبؤ السريري بنقص تروية عضلة القلب

في مؤتمر بكين تشي يوان، شارك البروفيسور لي جيان بينج، نائب رئيس مستشفى جامعة بكين الأول ومدير معهد طب القلب والأوعية الدموية، في استكشافات الذكاء الاصطناعي وممارساته الجديدة في تشخيص أمراض القلب التاجية والتنبؤ بنقص تروية عضلة القلب السريري تحت عنوان "الطرق والصعوبات في التنبؤ بنقص تروية عضلة القلب السريري". ويوفر هذا نهجًا جديدًا لتشخيص وعلاج المرضى المصابين بأمراض القلب التاجية، ويوسع التركيز من القلب إلى الكلى، وهو ما يُتوقع أن يمكّن الذكاء الاصطناعي من لعب دور أكبر في الطب السريري. هذه المقالة عبارة عن ملخص مفصل للخطاب.

اقرأ المقابلة كاملة:https://go.hyper.ai/5X9jM

نموذج الخلية ذو 310 مليون معلمة موجود هنا! نشر فريق جامعة تسينغهوا في مجلة Nature بحثًا بعنوان "النمذجة المتزامنة لـ 20 ألف جين"

واقترح فريق بحثي من جامعة تسينغهوا نموذجًا خلويًا كبيرًا يسمى sc-Foundation، والذي يتم تدريبه على أساس بيانات التعبير الجيني من 50 مليون خلية. يحتوي على 100 مليون معلمة ويمكنه معالجة حوالي 20 ألف جين في وقت واحد. وباعتباره نموذجًا أساسيًا، فإنه يُظهر تحسنًا ممتازًا في الأداء في العديد من المهام الطبية الحيوية اللاحقة مثل تعزيز عمق تسلسل الخلايا، والتنبؤ باستجابة الخلايا للأدوية، والتنبؤ باضطراب الخلايا. هذه المقالة عبارة عن تفسير مفصل ومشاركة للبحث.

شاهد التقرير الكامل:https://go.hyper.ai/v5i5K

4. كيف يمارس ممارسو الذكاء الاصطناعي العلوم؟ جامعة تسينغهوا AIR تشو هاو: الاستكشاف عبر الحدود من توليد النصوص إلى تصميم البروتين

مؤخرًا، شارك البروفيسور تشو هاو من معهد الصناعات الذكية بجامعة تسينغهوا، بصفته ممارسًا للكمبيوتر، مع الجميع التحديات المتعددة التي يواجهها العاملون في مجال الذكاء الاصطناعي في تصميم البروتين، ووصف أحدث الأبحاث المتطورة في مجال البروتين من ثلاثة جوانب: بنية البيانات، وخوارزمية التوليد، والتدريب المسبق للبروتين. يتناول هذا المقال المشاركة المتعمقة للأستاذ الدكتور تشو هاو.

شاهد التقرير الكامل:https://go.hyper.ai/PTyAp

مقالات موسوعية شعبية

1. نظرية القياس قانون القياس

2. اندماج الترتيب المتبادل RRF

3. مجال الإشعاع العصبي (NeRF)

4. فهم اللغة متعدد المهام على نطاق واسع (MMLU)

5. نظرية كولموغوروف-أرنولد للتمثيل

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://hyper.ai/wiki

معاينة البث المباشر لمحطة B

إيفريدو كانزياني هو أستاذ مساعد لعلوم الكمبيوتر في جامعة نيويورك وتلميذ يان ليكون. أصدر مؤخرًا فيديو "دورة الذكاء الاصطناعي" الربيعية. تتضمن نقاط المعرفة التي يتم تدريسها في كل فصل ما يلي: الاحتمال المنفصل ونظرية بايز الساذجة؛ الإدراك الحسي والانحدار اللوجستي؛ التحسين والإحصاء ومعالجة اللغة الطبيعية العصبية؛ تصنيف الشبكات العصبية وما إلى ذلك. هذا الأسبوع سوف تبث قناة Super Neuro TV الدورة التدريبية مباشرة على مدار 24 ساعة طوال أيام الأسبوع.

الجدول التالي هو معاينة للمحتوى الذي حدده المحرر↓↓↓

تاريخوقتمحتوى
الاثنين 1 يوليو18:00الجزء الأول: مقدمة إلى بايز الساذج
الثلاثاء 2 يوليو18:00الجزء الثاني من تصنيف بايز الساذج
الأربعاء 3 يوليو18:00الجزء 3 تقدير معاملات بايز الساذجة وتنعيم لابلاس
الخميس 4 يوليو18:00الجزء 4. تقييم المصنفات الثنائية
الجمعة 5 يوليو18:00الجزء 5: المُدْرِكات متعددة الفئات، الانحدار اللوجستي الثنائي ومتعدد الفئات
السبت 6 يوليو18:00الجزء 6: التحسين وصعود التدرج
الأحد 7 يوليو18:00محاضرة ألفريدو كانزياني حول التعلم الذاتي القائم على الطاقة

تبث قناة Super Neuro TV بثًا مباشرًا على مدار 24 ساعة طوال أيام الأسبوع. انقر للحصول على "المخللات الإلكترونية" في مجال الذكاء الاصطناعي:

http://live.bilibili.com/26483094

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://hyper.ai/events

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين. نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

  • توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة
  • يحتوي على أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
  • تفسير أكثر من 100 حالة بحثية من AI4Science
  • دعم البحث عن أكثر من 500 مصطلح ذي صلة
  • استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai