العد التنازلي لمدة 3 أيام! احجز موعدًا الآن لبث مؤتمر Apple WWDC24 المباشر؛ مجموعة بيانات التفضيلات المتعددة الوسائط واسعة النطاق RLAIF-V متاحة على الإنترنت، مما يقلل بشكل فعال من ظاهرة الهلوسة في MLLMs المختلفة

من 3 يونيو إلى 7 يونيو، تحديثات الموقع الرسمي لـ hyper.ai:
مجموعات البيانات العامة عالية الجودة: 10
مجموعة مختارة من الدروس التعليمية عالية الجودة: 2
اختيار المقالات المجتمعية: 3 مقالات
إدخالات الموسوعة الشعبية: 5
أهم المؤتمرات التي لها مواعيد نهائية في شهري يونيو ويوليو: 5
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات معيارية لأسئلة مخطط ChartQA
تغطي مجموعة البيانات 9.6 ألف سؤال مكتوب من قبل الإنسان و23.1 ألف سؤال تم إنشاؤها من ملخصات المخططات المكتوبة من قبل الإنسان، وهي مصممة لحل المشكلات المعقدة التي تنطوي على التفكير البصري والمنطقي.
الاستخدام المباشر:https://go.hyper.ai/5tJE9
2. مجموعة بيانات الاستشعار عن بُعد RS5M واسعة النطاق لإقران الصور والنصوص
تحتوي مجموعة بيانات RS5M على 5 ملايين صورة استشعار عن بعد مع أوصاف باللغة الإنجليزية. يتم الحصول على مجموعة البيانات هذه عن طريق فحص مجموعات البيانات المتاحة للجمهور والتي تتكون من صور ونصوص ومجموعات بيانات الاستشعار عن بعد (RS) المسمى باستخدام نموذج لغة بصرية مدرب مسبقًا (VLM).
الاستخدام المباشر:https://go.hyper.ai/jbwsV
3. مجموعة بيانات الصور والنصوص متعددة الوسائط CapsFusion-120M
تحتوي مجموعة البيانات هذه على معلومات الصور والنصوص من مجموعات البيانات LAION-2B وLAION-COCO، والتي يمكن استخدامها للتدريب المسبق متعدد الوسائط على نطاق واسع أو لمزيد من دراسة جودة بيانات الصور والنصوص.
الاستخدام المباشر:https://go.hyper.ai/pEE7u
4. ShareGPT4V مجموعة بيانات صور ونصوص عالية الجودة وكبيرة الحجم
تحتوي مجموعة البيانات على 1.2 مليون زوج من الصور والنصوص التي تعمل على محاذاة الميزات البصرية واللغوية بشكل فعال، وتعزيز قدرة النموذج على اتباع التعليمات، ودمج المزيد من المهام الأكاديمية مثل ScienceQA وTextVQA وSBU وما إلى ذلك.
الاستخدام المباشر:https://go.hyper.ai/9CVao
5. مجموعة بيانات التفضيلات متعددة الوسائط واسعة النطاق RLAIF-V
مجموعة بيانات RLAIF-V عبارة عن مجموعة بيانات تفضيلية متعددة الوسائط تم إنشاؤها بواسطة الذكاء الاصطناعي وتغطي مجموعة متنوعة من المهام والمجالات. تحتوي مجموعة البيانات على أكثر من 44757 زوجًا عالي الجودة للتدريب وتقييم نماذج اللغة الكبيرة متعددة الوسائط.
الاستخدام المباشر:https://go.hyper.ai/cG6fp
6. FoodLogoDet-1500 مجموعة بيانات عالية الجودة لاكتشاف شعارات الطعام
تتكون مجموعة البيانات من 1500 فئة، و99768 صورة، و145400 كائن. هذه هي أول وأكبر مجموعة بيانات متاحة للعامة حول الكشف عن ملصقات الأغذية.
الاستخدام المباشر:https://go.hyper.ai/eco23
7. مجموعة بيانات صور الطعام ZSFooD
تحتوي مجموعة البيانات على 20,603 صورة طعام تم جمعها من 10 مشاهد لمطاعم، يحتوي كل منها على العديد من كائنات الطعام الموضحة بمربعات محيطة، تتكون من 95,322 مربعًا محيطيًا و291 فئة.
الاستخدام المباشر:https://go.hyper.ai/6xrrC
8. مجموعة بيانات صور الطعام Food-1K
تحتوي مجموعة البيانات على أكثر من 1000 فئة من الأطعمة ذات الحبيبات الدقيقة وأكثر من 500000 صورة، وقد تم استخدامها بواسطة ICCV 2021 لمسابقة تحليل الأطعمة ذات الحبيبات الدقيقة على نطاق واسع Workshop LargeFineFoodAI.
الاستخدام المباشر:https://go.hyper.ai/sjZJi
9. مجموعة بيانات صور الطعام ISIA Ingredient-201
يوجد 201 فئة فرعية في مجموعة البيانات هذه، تغطي الأنواع الشائعة من فئات الأطعمة الموجودة. تم جمع صور الطعام في 5 مشاهد مرتبطة بالطعام، وتم جمع ما لا يقل عن 150 فئة من الطعام في كل مشهد.
الاستخدام المباشر:https://go.hyper.ai/bGe45
١٠. مجموعة بيانات أطباق الطعام ISIA Food-500
تحتوي مجموعة البيانات على 399,726 عنصرًا غذائيًا، مع أكثر من 500 طبق. يحتوي كل عنصر على اسم الطعام وصورة الطعام.
الاستخدام المباشر:https://go.hyper.ai/yqco5
لمزيد من مجموعات البيانات العامة، يرجى زيارة:
دروس تعليمية عامة مختارة
ويستخدم نموذج DynamiCrafter الذي أطلقته جامعة هونج كونج الصينية ومختبر Tencent AI وآخرون تقنية نشر الفيديو لمحاكاة أنماط الحركة في العالم الحقيقي، وعند دمجه مع التعليمات النصية، يمكنه تحويل الصور إلى مقاطع فيديو ديناميكية. لقد قام هذا البرنامج التعليمي ببناء بيئة سير عمل ComfyUI لك. لا داعي للقلق بشأن أخطاء اتصال العقدة. فقط قم بتحميل الصور وأدخل النص للعمل!
تشغيل عبر الإنترنت:https://go.hyper.ai/PWzJR
2. لا تنتظر! تعال واستمتع بتجربة GLM-4-9B-Chat Demo
أصدرت شركة Zhipu AI هذا الأسبوع أحدث إنجاز مفتوح المصدر للنموذج الأساسي الكبير GLM-4 - GLM-4-9B، والذي يتمتع بقدرات متعددة الوسائط لأول مرة. من أجل السماح للجميع بتجربة هذا النموذج مفتوح المصدر الذي يدعي أنه "يتفوق على Llama3-8B" في أقرب وقت ممكن، أطلق Chao Neuro البرنامج التعليمي "GLM-4-9B-Chat Demo". لا حاجة لإدخال أي أوامر، فقط انقر فوق "استنساخ" وابدأ في تجربة الأداء الممتاز لبرنامج GLM-4-9B-Chat على الفور.
تشغيل عبر الإنترنت:https://go.hyper.ai/hc5OK
مقالات المجتمع
اقترحت مجموعة أبحاث هونغ ليانغ في جامعة شنغهاي جياو تونغ شبكة PROTLGN العصبية الرسومية التي تدرك البيئة الدقيقة، والتي يمكنها تعلم وتوقع مواقع طفرة الأحماض الأمينية المفيدة من البنية ثلاثية الأبعاد للبروتينات، وتوجيه تصميم الطفرات في موقع واحد والطفرات متعددة المواقع للبروتينات ذات وظائف مختلفة. إن البروتينات الطافرة أحادية النقطة المصممة بواسطة PROTLGN والتي تتجاوز 40% متفوقة على نظيراتها من النوع البري. وقد تم نشر النتائج ذات الصلة في "JCM".
شاهد التقرير الكامل:https://go.hyper.ai/6FkFu
اقترح فريق كانج جيانكيانج من جامعة ووهان للتكنولوجيا نموذجًا كهروكيميائيًا مبسطًا للتعلم الجماعي (ELM) + FIE. يتنبأ ELM بدقة بتركيز أيون الليثيوم في القطب الصلب، مما يحقق تنبؤًا أكثر دقة بالجهد مقارنة بنموذج واحد، كما أن تعقيده الحسابي أقل بكثير من تعقيد نموذج P2D. تتنبأ FIE بدقة بتركيز أيونات الليثيوم في الإلكتروليت بالقرب من جامعي التيار الموجب والسالب.
شاهد التقرير الكامل:https://go.hyper.ai/CWvce
اقترح فريق البحث التابع للأستاذ مي يونغفينج من قسم علوم المواد بجامعة فودان طريقة تحليل العناصر المحدودة شبه الثابتة متعددة المستويات، وقاموا بتصميم وبناء ستة أنواع من الهياكل الدقيقة ثلاثية الأبعاد المجمعة من نانوفيلم السيليكون / الكروم وأجهزة الكشف البصرية ثلاثية الأبعاد المقابلة، مما يؤكد التنوع الجيد والعملية الصناعية للتكنولوجيا. وقد نشرت النتائج ذات الصلة في مجلة "نيتشر".
شاهد التقرير الكامل:https://go.hyper.ai/2s73Q
مقالات موسوعية شعبية
1. القاعدة النووية
2. نمذجة اللغة المقنعة (MLM)
3. الذاكرة طويلة المدى والذاكرة قصيرة المدى الذاكرة طويلة المدى
4. YOLOv10 الكشف عن الكائنات من البداية إلى النهاية في الوقت الفعلي
5. شبكات كولموغوروف-أرنولد
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
معاينة البث المباشر لمحطة B
ستعقد شركة أبل مؤتمرها السنوي للمطورين WWDC24 في 11 يونيو (الثلاثاء المقبل) بتوقيت بكين. سيتم بث حساب HyperAI Super Neural Video و Bilibili في الوقت الفعلي. مرحبًا بك في مسح رمز الاستجابة السريعة لتحديد موعد للبث المباشر↓

من أجل مساعدتك في الحصول على فهم أعمق لمعلومات Apple ذات الصلة،ستستمر غرفة البث المباشر في محطة Super Neuro B في بث فيديو "Apple Special".يتضمن: مؤتمرات WWDC السابقة، والمقابلات التنفيذية، والأفلام الوثائقية ذات الصلة والمحتوى الغني الآخر.
الجدول التالي هو معاينة للمحتوى الذي حدده المحرر↓↓↓
تاريخ | وقت | محتوى |
الاثنين 10 يونيو | 18:00 | ستيف جوبز |
الثلاثاء 11 يونيو | 1:00 | مؤتمر آبل WWDC24 |
الأربعاء 12 يونيو | 18:00 | ما الذي يجعل شركة أبل |
الخميس 13 يونيو | 18:00 | الإصدار الأول للآيفون |
الجمعة 14 يونيو | 18:00 | تاريخ ستيف جوبز |
السبت 15 يونيو | 18:00 | كيف نجت شركة أبل من الإفلاس تقريبًا |
الأحد 16 يونيو | 18:00 | تاريخ تيم كوك |
تبث قناة Super Neuro TV بثًا مباشرًا على مدار 24 ساعة طوال أيام الأسبوع. انقر للحصول على "المخللات الإلكترونية" في مجال الذكاء الاصطناعي:
http://live.bilibili.com/26483094
الموعد النهائي للمؤتمر هو يونيو-يوليو

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://hyper.ai/events
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة
* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: