HyperAI

تم إطلاق أول نموذج كبير متعدد الوسائط من Meta بنقرة واحدة! أول مجموعة بيانات للتطريز متعدد الإبر متاحة على الإنترنت، وتحتوي على أكثر من 30 ألف صورة

特色图像

أعلن زوكربيرج عن إطلاق أول نموذج كبير متعدد الوسائط Llama 3.2 في خطابه الرئيسي في Meta Connect 2024! يتوفر هذا النموذج بنسختين، 11B و90B، ليصبحا أول طرازين من سلسلة Llama يدعمان المهام المتعددة الوسائط. وبحسب البيانات الرسمية، فإن أداء هذين النموذجين مفتوحي المصدر تجاوز أداء النماذج مغلقة المصدر.

لا أستطيع الانتظار لنشره.أطلقنا على الفور برنامجًا تعليميًا للنشر بنقرة واحدة للنموذج 11B على الموقع الرسمي لـ hyper.ai.مرحباً بالجميع لتجربة التفكير معًا~

تشغيل عبر الإنترنت:https://go.hyper.ai/DKGzm

من 23 سبتمبر إلى 27 سبتمبر، تم تحديث الموقع الرسمي لـ hyper.ai بسرعة:

* مجموعات البيانات العامة عالية الجودة: 10

* دروس تعليمية مختارة عالية الجودة: 2

* اختيار المقالات المجتمعية: 3 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات مع الموعد النهائي في أكتوبر: 7

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات التطريز متعدد الإبر MSEmbGAN

تُعد مجموعة البيانات هذه أول مجموعة بيانات للتطريز يتم شرحها بالتفصيل باستخدام تسميات الغرزة المفردة والغرز المتعددة. تم إنتاج أكثر من 30 ألف صورة، بما في ذلك صور التطريز وصور المحتوى المقابلة، باستخدام برنامج التطريز الاحترافي (Wilcom 9.0). ستساهم هذه الورقة في توفير مجموعة البيانات الخاصة بالتطريز متعدد الإبر للباحثين الآخرين في مجال البحث هذا.

الاستخدام المباشر:https://go.hyper.ai/urNGE

2. مجموعة بيانات الأفلام مجموعة بيانات معلومات الأفلام

تحتوي مجموعة البيانات هذه على بيانات وصفية مفصلة لـ 45000 فيلم في مجموعة بيانات MovieLens الكاملة، والتي تم إصدارها جميعًا قبل يوليو 2017. لا تغطي مجموعة البيانات هذه المعلومات الأساسية حول الأفلام فحسب، مثل الملصقات والخلفيات والميزانيات والإيرادات، بل تتضمن أيضًا معلومات مفصلة مثل تاريخ الإصدار واللغة وبلد الإنتاج والشركة.

الاستخدام المباشر:https://go.hyper.ai/SDwXX

3. مجموعة بيانات الروبوت الحقيقي Open X-Embodiment

تجمع مجموعة البيانات بيانات من 22 نوعًا مختلفًا من الروبوتات، من الروبوتات ذات الذراع الواحدة إلى الروبوتات ذات اليدين والروبوتات ذات الأربع أرجل، والتي تم جمعها بواسطة 21 مؤسسة مختلفة، وتغطي 527 مهارة مختلفة و160266 مهمة. تم إنشاؤه من خلال تجميع 60 مجموعة بيانات روبوتية موجودة من 34 مختبرًا لأبحاث الروبوتات حول العالم، مما يعرض مجموعة متنوعة من مهام وبيئات الروبوتات.

الاستخدام المباشر:https://go.hyper.ai/Cqlw6

4. مجموعة بيانات أفلام TMDB 5k مجموعة بيانات معلومات الأفلام

تحتوي مجموعة البيانات هذه على معلومات مفصلة حول أفلام 5K، معظمها من الولايات المتحدة على مدى السنوات المائة الماضية (1916-2017). تم تصميم مجموعة البيانات هذه لمساعدة الباحثين والمحللين على استكشاف الاتجاهات الشائعة واتجاهات الاستثمار في صناعة الأفلام، فضلاً عن تقديم اقتراحات مرجعية للوافدين الجدد إلى صناعة الأفلام.

الاستخدام المباشر:https://go.hyper.ai/zaRFY

5. مجموعة بيانات التحسين ذات الحبيبات الدقيقة LongCite-45k للنموذج الكبير

تحتوي مجموعة البيانات على 44600 من بيانات الإجابة على الأسئلة عالية الجودة مع الاستشهادات على مستوى الجملة، وتدعم معالجة النصوص الطويلة بحد أقصى يبلغ 128 ألف رمز، وتمكن المستخدمين من التحقق من دقة إجابات النموذج من خلال إنشاء استشهادات دقيقة على مستوى الجملة.

الاستخدام المباشر:https://go.hyper.ai/omO5f

6. مجموعة بيانات أفلام TMDB الكاملة لعام 2024

TMDb (قاعدة بيانات الأفلام) هي قاعدة بيانات شاملة للأفلام. تحتوي مجموعة البيانات هذه على 1000 ألف فيلم من قاعدة بيانات TMDB، وتوفر معلومات حول الأفلام بما في ذلك التفاصيل مثل العنوان والتقييم وتاريخ الإصدار والإيرادات والنوع وما إلى ذلك.

الاستخدام المباشر:https://go.hyper.ai/r9ks2

7. مجموعة بيانات الاستدلال الرياضي متعدد الوسائط InfiMM-WebMath-40B

هذه المجموعة من البيانات عبارة عن مجموعة بيانات كبيرة مفتوحة المصدر ومتعددة الوسائط مصممة خصيصًا لمهام التفكير الرياضي، وتحتوي على 2.4 ألف صفحة ويب، و8.5 ألف عنوان URL للصور ذات الصلة، و40 مليار رمز، وقد تم استخراجها جميعًا وتصفيتها بعناية من قاعدة بيانات CommonCrawl (2019-2023).

الاستخدام المباشر:https://go.hyper.ai/P8m9l

8. مجموعة بيانات تحسين المساعد الصوتي VoiceAssistant-400K

VoiceAssistant-400K عبارة عن مجموعة بيانات مُحسّنة للمساعدين الصوتيين. ويهدف هذا إلى مساعدة النموذج على تقليل إنشاء رموز التعليمات البرمجية عند تقديم خدمات المساعد الصوتي وتعزيز التطبيق العملي للنموذج في التطبيقات الحقيقية.

الاستخدام المباشر:https://go.hyper.ai/KGIM0

9. أفضل 5 آلاف ألبوم على الإطلاق - مجموعة بيانات مراجعة ألبومات الموسيقى

تحتوي هذه المجموعة من البيانات على http://rateyourmusic.com ألبومات 5k الأكثر شعبية على الإطلاق كما صوت عليها مستخدمو المجتمع. تم فحص مجموعة البيانات في 12 أكتوبر 2021، وتتضمن سمات مثل المرتبة واسم الألبوم واسم الفنان وتاريخ الإصدار والنوع والوصف ومتوسط التقييم وعدد التقييمات وعدد المراجعات.

الاستخدام المباشر:https://go.hyper.ai/c4Olt

10. مجموعة بيانات اتجاهات الأغاني اليومية لأفضل 200 أغنية على Spotify

تحتوي مجموعة البيانات على قوائم أفضل 200 أغنية على Spotify لكل يوم في جميع أنحاء العالم من عام 2017 إلى عام 2021. تغطي مجموعة البيانات هذه أكثر من 350 ألف أغنية، مما يوفر للباحثين وعشاق الموسيقى معلومات غنية لتحليل اتجاهات الشعبية وتفضيلات الموسيقى والدراسات الأخرى ذات الصلة.

الاستخدام المباشر:https://go.hyper.ai/afvbK

لمزيد من مجموعات البيانات العامة، يرجى زيارة:

https://hyper.ai/datasets

دروس تعليمية عامة مختارة

1. نشر Llama-3.2-11B-Vision-Instruct بنقرة واحدة

النموذج هو حجم معلمة 11B من عائلة النماذج الكبيرة متعددة الوسائط Llama 3.2-Vision، ويدعم إدخال الصور عالية الدقة (1120 × 1120 بكسل)، ويستخدم آلية انتباه متقاطع مع متغير الدردشة لإكمال النموذج الأساسي وتعديل التعليمات. انتقل إلى الموقع الرسمي لاستنساخ الحاوية وبدء تشغيلها، ثم انسخ عنوان API مباشرةً، ومن ثم يمكنك تجربة استنتاج النموذج.

الاستخدام المباشر:https://go.hyper.ai/DKGzm

٢. عرض توضيحي لجيل الرسوم التوضيحية لقصص الأطفال الخيالية من ComfyUl Littletinies

يتمكن النموذج من إنشاء صور مرسومة يدويًا بأسلوب الرسوم المتحركة استنادًا إلى مطالبات نصية. يعد هذا النموذج مناسبًا بشكل خاص لإنشاء رسوم توضيحية غريبة ومنمقة ذات جماليات كرتونية كلاسيكية، كما تتميز الصور التي يولدها بملمس مرسوم يدويًا وضربات فرشاة ناعمة وألوان ناعمة. تم نشر النموذج والبيئة، ويمكنك إنشاء الاستدلالات وفقًا لإرشادات البرنامج التعليمي.

الاستخدام المباشر:https://go.hyper.ai/YHu0a

لقد قمنا أيضًا بتأسيس مجموعة تبادل تعليمية حول الانتشار المستقر. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة والتعليق على [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق ~

مقالات المجتمع

1. يمكن إنشاء أنماط التطريز بذكاء! أصدر فريق الحوسبة البصرية والمنسوجات الرقمية بجامعة ووهان للنسيج أول نموذج شبكة تنافسية توليدية للتطريز متعدد الغرز، والذي تم قبوله من قبل مجلة TVCG الرائدة

اقترحت مجموعة البحث التابعة لـ Hu Xinrong من كلية الكمبيوتر والذكاء الاصطناعي بجامعة ووهان للنسيج نموذج شبكة تنافسية توليدية متعددة الغرز للتطريز MSEmbGAN وأنشأت أكبر مجموعة بيانات للتطريز حاليًا. وقد تم قبول الورقة ذات الصلة أيضًا من قبل مجلة TVCG الرائدة. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد الملخص الكامل:https://go.hyper.ai/5t8NQ

2. نتائج جديدة في المجلة الموثوقة Cell Discovery! اقترح الفريق بقيادة هونغ ليانغ من جامعة شنغهاي جياو تونغ نموذج CPDiffusion لتصميم البروتينات الوظيفية بشكل آلي بالكامل وبتكلفة منخفضة للغاية

قام فريق هونغ ليانغ من جامعة شنغهاي جياو تونغ بتصميم إطار عمل لنموذج احتمال الانتشار الذي يمكنه تعلم العلاقة الضمنية بين تسلسل البروتين وبنيته ووظيفته بتكلفة تدريب وتكلفة بيانات منخفضة للغاية، وبالتالي توليد تسلسلات بروتينية متنوعة. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد التقرير الكامل:https://go.hyper.ai/ziRvz

3. تم اختيارهم لـ ECCV 2024! بتغطية أكثر من 54000 صورة، اقترح معهد ماساتشوستس للتكنولوجيا نموذجًا عامًا لتجزئة الصور الطبية، ScribblePrompt، والذي يتفوق على SAM

قام فريق من مختبر علوم الكمبيوتر والذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا، بالتعاون مع باحثين من مستشفى ماساتشوستس العام وكلية الطب بجامعة هارفارد، باقتراح نموذج عام لتجزئة الصور الطبية الحيوية التفاعلية، ScribblePrompt، وهي أداة تجزئة تعتمد على الشبكة العصبية التي تدعم المعلقين باستخدام طرق شرح مختلفة مثل الكتابة على الجدران والنقر والمربعات المحددة لأداء مهام تجزئة الصور الطبية الحيوية بمرونة، حتى بالنسبة للعلامات وأنواع الصور غير المدربة. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد التقرير الكامل:https://go.hyper.ai/QQjAf

مقالات موسوعية شعبية

1. وظيفة السيني

2. اختبار t المقترن

3. التعلم التبايني

4. التعلم شبه الخاضع للإشراف

5. زيادة البيانات

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة

* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 100 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai