ترجمة صينية حصرية! بدأت دورة الذكاء الاصطناعي الربيعية لطالب ليكون ألفريدو؛ تنزيل مجموعة بيانات الاستشعار عن بعد CVPR'24

أصدر ألفريدو كانزياني، الأستاذ المساعد في علوم الكمبيوتر بجامعة نيويورك وتلميذ يان ليكون، مؤخرًا "دورة الذكاء الاصطناعي" الربيعية، والتي تغطي موضوعات مثل الاحتمالات المنفصلة وبايز الساذج، والمُدْرِكات والانحدار اللوجستي، والتحسين، والإحصاء ومعالجة اللغة الطبيعية العصبية، وتصنيف الشبكات العصبية، والشبكات العصبية المتكررة والشبكات العصبية التلافيفية.
هذا الأسبوع، سوف تقوم HyperAI ببث الدورة التدريبية مباشرة على B Station 24/7. دعونا نتعلم معا~
رابط المشاهدة:
http://live.bilibili.com/26483094
من 24 يونيو إلى 28 يونيو، تحديثات الموقع الرسمي لـhyper.ai:
- مجموعات البيانات العامة عالية الجودة: 10
- مجموعة مختارة من الدروس التعليمية عالية الجودة: 3
- اختيار المقالات المجتمعية: 4 مقالات
- إدخالات الموسوعة الشعبية: 5
- أهم المؤتمرات التي لها مواعيد نهائية في يوليو: 4
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات تتبع التعليمات متعددة الوسائط للاستشعار عن بُعد من GeoChat Instruct
تحتوي مجموعة البيانات على ما يقرب من 318000 تعليمة وتهدف إلى توسيع نطاق التكيف مع التعليمات المتعددة الوسائط إلى مجال الاستشعار عن بعد لتدريب المساعدين المحادثة متعددي المهام. وقد تم قبول نتائج الورقة ذات الصلة من قبل CVPR 2024.
الاستخدام المباشر:https://go.hyper.ai/CXu0K
2. مجموعة بيانات تجزئة صور الاستشعار عن بعد الكبيرة RRSIS-D
تحتوي مجموعة البيانات على 17,402 ثلاثية من أقنعة وصف الصورة تغطي مجموعة متنوعة من الدقة المكانية واتجاهات الكائنات. وقد تم قبول نتائج الورقة ذات الصلة من قبل CVPR 2024.
الاستخدام المباشر:https://go.hyper.ai/1VRQG
3. مجموعة بيانات محلل الأرض ومجموعة بيانات رسم الخرائط للاستشعار عن بعد
تُستخدم مجموعة البيانات هذه لتدريب وتقييم طرق التحليل على عمليات مسح LiDAR الجوية الكبيرة وغير المنظمة. تحتوي مجموعة البيانات على 7 مشاهد تغطي مساحة تزيد عن 7.7 كيلومتر مربع وإجمالي 98 مليون نقطة ثلاثية الأبعاد. وقد تم قبول نتائج الورقة ذات الصلة من قبل CVPR 2024.
الاستخدام المباشر:https://go.hyper.ai/3pFjm
4. مجموعة بيانات Harvard-GF3300 لأمراض الشبكية العصبية (الجلوكوما)
هذه المجموعة من البيانات هي مجموعة بيانات لأمراض الأعصاب الشبكية (الجلوكوما) تتضمن 3300 موضوعًا، وتحتوي على بيانات صور ثنائية وثلاثية الأبعاد. تحتوي مجموعة البيانات على عدد متساوٍ من الأشخاص من المجموعات العرقية الرئيسية الثلاث (الأبيض والأسود والآسيوي)، مما يتجنب مشكلات عدم التوازن في البيانات التي قد تخلط بين قضايا التعلم العادل.
الاستخدام المباشر:https://go.hyper.ai/vIhu6
5. صور الأشعة السينية للأسنان للتحليل مجموعة بيانات صور الأشعة السينية للأسنان
تحتوي مجموعة البيانات هذه على صور الأشعة السينية المتنوعة للتصوير المقطعي التقويمي للأسنان (OPG)، و70 عينة عالية الجودة. من خلال توفير التعليقات التوضيحية، يمكن استخدام مجموعة البيانات هذه لتدريب واختبار نماذج التعلم الآلي لمهام تحليل صور الأسنان مثل تصنيف نوع الأسنان، واكتشاف الشذوذ، وما إلى ذلك.
الاستخدام المباشر:https://go.hyper.ai/vK9zz
6. مجموعة بيانات الأشعة السينية للكسور متعددة المناطق
تحتوي مجموعة البيانات على صور أشعة سينية مكسورة وغير مكسورة تغطي جميع مناطق الجسم التشريحية بما في ذلك الأطراف السفلية والأطراف العلوية والعمود الفقري القطني والوركين والركبتين وما إلى ذلك. وتنقسم مجموعة البيانات إلى مجلدات للتدريب والاختبار والتحقق، بإجمالي 10580 بيانات صورة أشعة سينية.
الاستخدام المباشر:https://go.hyper.ai/Yk1bA
7. مجموعة بيانات التعرف على صور الفاكهة والخضروات
تحتوي مجموعة البيانات على صور لـ 10 أنواع من الفواكه و 26 نوعًا من الخضروات، وتنقسم كل فئة إلى مجموعات تدريب واختبار وتحقق، مما يوفر مجموعة متنوعة لمهام التعرف على الصور.
الاستخدام المباشر:https://go.hyper.ai/FdfRK
تحتوي مجموعة البيانات على معلومات حول 15,939 شخصية مشهورة من مختلف أنواع الوسائط والأنواع. يتضمن كل إدخال تفاصيل حول الشخصية ومصدر الوسائط ومشهدًا فريدًا يتضمن الشخصية.
الاستخدام المباشر:https://go.hyper.ai/wf1q1
9. RepLiQA عبارة عن مجموعة بيانات محتملة للإجابة على الأسئلة من أجل المقارنة المعيارية
RepLiQA عبارة عن مجموعة بيانات تقييمية تحتوي على ثلاثيات "السياق - السؤال - الإجابة" التي تغطي 17 موضوعًا أو فئة من المستندات، وهي مصممة لاختبار قدرة نماذج اللغة الكبيرة (LLMs) على العثور على المعلومات السياقية واستخدامها في المستندات المقدمة.
الاستخدام المباشر:https://go.hyper.ai/ZkSYD
10. مجموعة بيانات تقييم أمان الشبكة النموذجية الكبيرة CS-Eval
وتغطي مجموعة البيانات 11 مجالًا رئيسيًا لأمن الشبكات، و42 مجالًا فرعيًا، و4369 سؤالًا من متعدد الاختيارات، وأسئلة صواب أو خطأ، وأسئلة استخراج المعرفة. إنه يوفر مهام تقييم شاملة تعتمد على المعرفة والممارسة، ويدعم التقييم الذاتي للمستخدم، ويوفر مرجعًا وإلهامًا لتنفيذ نماذج واسعة النطاق في مجال أمان الشبكات.
الاستخدام المباشر:https://go.hyper.ai/ziacf
لمزيد من مجموعات البيانات العامة، يرجى زيارة:
دروس تعليمية عامة مختارة
1. عرض توضيحي للتنبؤ الهرمي للتصنيف البيولوجي باستخدام Bioclip
يمكن لهذا العرض التوضيحي التعليمي تصنيف صورة بيولوجية معينة حسب العائلة أو الجنس أو النوع وما إلى ذلك. وهو إصدار Gradio للنموذج الموجود في أفضل ورقة طلابية "BioCLIP: نموذج أساسي لرؤية شجرة الحياة" من CVPR2024.
تشغيل عبر الإنترنت:https://go.hyper.ai/OEWk1
2. InstantStyle - مولد صور متسق
InstantStyle هو إطار عمل لإنشاء نص إلى صورة تم تطويره بواسطة فريق InstantX التابع لـ Xiaohongshu، والذي يحقق نقل الأسلوب مع الحفاظ على إمكانية التحكم في نص المحتوى. لقد قام هذا البرنامج التعليمي ببناء البيئة المناسبة لك، ويمكنك تجربتها بنقرة واحدة!
تشغيل عبر الإنترنت:https://go.hyper.ai/E6GuW
3. قم بإنشاء مقالات عالية الجودة في 5 ثوانٍ، يبدأ Llama 3-Chinese-Chat Demo بنقرة واحدة!
هذا النموذج هو نموذج دردشة صيني يعتمد على نموذج Meta-Llama-3-8b-Instruct الذي تم ضبطه خصيصًا للغة الصينية. وبالمقارنة مع نموذج Meta-Llama-3-8b-Instruct الأصلي، فقد تم تقليل عدد "الأسئلة الصينية مع الردود الإنجليزية" والأسئلة المختلطة باللغتين الصينية والإنجليزية بشكل كبير. كل ما عليك فعله هو استنساخ الحاوية وبدء تشغيلها، ثم نسخ عنوان API الناتج مباشرةً لتجربة الاستدلال على النموذج.
تشغيل عبر الإنترنت:https://go.hyper.ai/BLHcM
مقالات المجتمع
استخدم علماء من المملكة المتحدة واليابان تكنولوجيا التعلم الآلي لتصميم نظام بحثي يجمع بين الأساليب التي يقودها الباحثون والأساليب التي تعتمد على البيانات، ونجحوا في إنتاج أقوى مغناطيس فائق التوصيل قائم على الحديد معروف في العالم. هذه المقالة عبارة عن تفسير مفصل ومشاركة للبحث.
عرض تفاصيل الحدث:https://go.hyper.ai/RxV9x
في مؤتمر بكين تشي يوان، شارك البروفيسور لي جيان بينج، نائب رئيس مستشفى جامعة بكين الأول ومدير معهد طب القلب والأوعية الدموية، في استكشافات الذكاء الاصطناعي وممارساته الجديدة في تشخيص أمراض القلب التاجية والتنبؤ بنقص تروية عضلة القلب السريري تحت عنوان "الطرق والصعوبات في التنبؤ بنقص تروية عضلة القلب السريري". ويوفر هذا نهجًا جديدًا لتشخيص وعلاج المرضى المصابين بأمراض القلب التاجية، ويوسع التركيز من القلب إلى الكلى، وهو ما يُتوقع أن يمكّن الذكاء الاصطناعي من لعب دور أكبر في الطب السريري. هذه المقالة عبارة عن ملخص مفصل للخطاب.
اقرأ المقابلة كاملة:https://go.hyper.ai/5X9jM
واقترح فريق بحثي من جامعة تسينغهوا نموذجًا خلويًا كبيرًا يسمى sc-Foundation، والذي يتم تدريبه على أساس بيانات التعبير الجيني من 50 مليون خلية. يحتوي على 100 مليون معلمة ويمكنه معالجة حوالي 20 ألف جين في وقت واحد. وباعتباره نموذجًا أساسيًا، فإنه يُظهر تحسنًا ممتازًا في الأداء في العديد من المهام الطبية الحيوية اللاحقة مثل تعزيز عمق تسلسل الخلايا، والتنبؤ باستجابة الخلايا للأدوية، والتنبؤ باضطراب الخلايا. هذه المقالة عبارة عن تفسير مفصل ومشاركة للبحث.
شاهد التقرير الكامل:https://go.hyper.ai/v5i5K
مؤخرًا، شارك البروفيسور تشو هاو من معهد الصناعات الذكية بجامعة تسينغهوا، بصفته ممارسًا للكمبيوتر، مع الجميع التحديات المتعددة التي يواجهها العاملون في مجال الذكاء الاصطناعي في تصميم البروتين، ووصف أحدث الأبحاث المتطورة في مجال البروتين من ثلاثة جوانب: بنية البيانات، وخوارزمية التوليد، والتدريب المسبق للبروتين. يتناول هذا المقال المشاركة المتعمقة للأستاذ الدكتور تشو هاو.
شاهد التقرير الكامل:https://go.hyper.ai/PTyAp
مقالات موسوعية شعبية
1. نظرية القياس قانون القياس
2. اندماج الترتيب المتبادل RRF
3. مجال الإشعاع العصبي (NeRF)
4. فهم اللغة متعدد المهام على نطاق واسع (MMLU)
5. نظرية كولموغوروف-أرنولد للتمثيل
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
معاينة البث المباشر لمحطة B
إيفريدو كانزياني هو أستاذ مساعد لعلوم الكمبيوتر في جامعة نيويورك وتلميذ يان ليكون. أصدر مؤخرًا فيديو "دورة الذكاء الاصطناعي" الربيعية. تتضمن نقاط المعرفة التي يتم تدريسها في كل فصل ما يلي: الاحتمال المنفصل ونظرية بايز الساذجة؛ الإدراك الحسي والانحدار اللوجستي؛ التحسين والإحصاء ومعالجة اللغة الطبيعية العصبية؛ تصنيف الشبكات العصبية وما إلى ذلك. هذا الأسبوع سوف تبث قناة Super Neuro TV الدورة التدريبية مباشرة على مدار 24 ساعة طوال أيام الأسبوع.
الجدول التالي هو معاينة للمحتوى الذي حدده المحرر↓↓↓
تاريخ | وقت | محتوى |
---|---|---|
الاثنين 1 يوليو | 18:00 | الجزء الأول: مقدمة إلى بايز الساذج |
الثلاثاء 2 يوليو | 18:00 | الجزء الثاني من تصنيف بايز الساذج |
الأربعاء 3 يوليو | 18:00 | الجزء 3 تقدير معاملات بايز الساذجة وتنعيم لابلاس |
الخميس 4 يوليو | 18:00 | الجزء 4. تقييم المصنفات الثنائية |
الجمعة 5 يوليو | 18:00 | الجزء 5: المُدْرِكات متعددة الفئات، الانحدار اللوجستي الثنائي ومتعدد الفئات |
السبت 6 يوليو | 18:00 | الجزء 6: التحسين وصعود التدرج |
الأحد 7 يوليو | 18:00 | محاضرة ألفريدو كانزياني حول التعلم الذاتي القائم على الطاقة |
تبث قناة Super Neuro TV بثًا مباشرًا على مدار 24 ساعة طوال أيام الأسبوع. انقر للحصول على "المخللات الإلكترونية" في مجال الذكاء الاصطناعي:
http://live.bilibili.com/26483094

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://hyper.ai/events
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين. نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
- توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة
- يحتوي على أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
- تفسير أكثر من 100 حالة بحثية من AI4Science
- دعم البحث عن أكثر من 500 مصطلح ذي صلة
- استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: