HyperAI

أفضل ورقة ICML SD3 التعليمية العامة عبر الإنترنت! DreamBench++ هو معيار جديد لتقييم الصور تلقائيًا، مما يحقق التوافق العميق مع التفضيلات البشرية

特色图像

تم الإعلان مؤخرًا عن أفضل أوراق ICML 2024! يتضمن ذلك "نموذج المشاهير على الإنترنت" لتوليد الصور السنوية - Stable Diffusion 3 (SD3 باختصار). SD3 هو أحدث نموذج لتوليد النص إلى صورة تم تطويره بواسطة Stability AI، والذي تم إتاحته مفتوح المصدر للشبكة بأكملها منذ بعض الوقت!هايبر ايه اي  أطلقت Super Neuro الآن برنامجًا تعليميًا حول كيفية تشغيل SD3 في سير عمل ComfyUI.الجميع مدعوون لتجربة الابتكار التكنولوجي لـ SD3 أثناء قراءة المقال!

رابط البرنامج التعليمي SD3:https://go.hyper.ai/ojO3g

من 22 يوليو إلى 26 يوليو، تحديثات الموقع الرسمي لـhyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3

* اختيار المقالات المجتمعية: 4 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات مع الموعد النهائي في أغسطس: 4

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات صور DreamBooth

تحتوي مجموعة البيانات على 30 موضوعًا من فئات مختلفة، بما في ذلك 9 كائنات حية (مثل الكلاب والقطط) و21 كائنًا، مع 4 إلى 6 صور لكل موضوع. إنه يسمح بتدريب النموذج باستخدام عدد صغير من الصور، مما يتيح له إنشاء صور لهذا الفرد المحدد في العديد من السياقات المختلفة مع الحفاظ على ميزاته المرئية الرئيسية.

الاستخدام المباشر:https://go.hyper.ai/Jiqg6

2. مجموعة بيانات المصطلحات الصينية واسعة النطاق من ChlD

تحتوي مجموعة البيانات على 581 ألف فقرة و729 ألف فراغ، وتغطي مجالات متعددة. في ChID، يتم استبدال العبارات الاصطلاحية في الفقرات بمسافات بيضاء. بالنسبة لكل فراغ، يتم توفير قائمة من العبارات المرشحة بما في ذلك العبارة الذهبية كخيار.

الاستخدام المباشر:https://go.hyper.ai/dt4AR

3. مجموعة بيانات مطابقة الشعر الكلاسيكي الصيني CCPM

هذه المجموعة من البيانات هي مجموعة بيانات مطابقة الشعر الكلاسيكي الصيني التي أطلقتها جامعة تسينغهوا في عام 2021، والتي تتضمن مجموعة تدريب (21778 جملة) ومجموعة تحقق (2720 جملة) ومجموعة اختبار (2720 جملة).

الاستخدام المباشر:https://go.hyper.ai/ymhF6

4. مجموعة بيانات فهم الحوارات متعددة الصور والمنعطفات فائقة الطول MMDU

يتكون معيار MMDU من 110 حوارات عالية الجودة متعددة الصور ومتعددة الأدوار مع أكثر من 1600 سؤال، كل منها مع إجابة طويلة مفصلة. تتضمن المشكلات في MMUD ما بين 2 إلى 20 صورة، بمتوسط طول علامة الصورة والنص 8.2 ألف علامة وطول أقصى للصورة والنص 18 ألف علامة، مما يشكل تحديات كبيرة للنماذج واسعة النطاق متعددة الوسائط الحالية.

الاستخدام المباشر:https://go.hyper.ai/vNyjl

5. مجموعة بيانات الكائنات ثلاثية الأبعاد ModeINet10 Princeton

مجموعة بيانات ModelNet10 هي جزء من مجموعة بيانات ModelNet40 وتحتوي على 4,899 شكلًا محاذيًا مسبقًا لـ 10 فئات من نماذج أثاث CAD مثل أحواض الاستحمام والأسرة والكراسي والطاولات. ومن بينها، يتم استخدام 3,991 (80%) أشكالًا للتدريب، ويتم استخدام 908 (20%) أشكالًا للاختبار.

الاستخدام المباشر:https://go.hyper.ai/ZPFKs

6. مجموعة بيانات اكتشاف السقوط

تحتوي مجموعة البيانات على مجلد صور ومجلد تسميات. يحتوي مجلد الصور على مجلدين فرعيين train (374 صورة) للتدريب وVal (111 صورة) للتحقق.

الاستخدام المباشر:https://go.hyper.ai/WAKTy

7. مجموعة بيانات موسوعة baike_qa2019 للأسئلة والأجوبة بصيغة JSON

تحتوي مجموعة البيانات على 1.5 مليون سؤال وإجابة عالية الجودة تمت تصفيتها مسبقًا، حيث ينتمي كل سؤال إلى فئة واحدة. هناك 492 فئة في المجموع، منها 434 فئة لها تكرار 10 مرات أو أكثر.

الاستخدام المباشر:https://go.hyper.ai/3KWJ8

8. مجموعة بيانات معيار التقييم التلقائي للصور DreamBench++

DreamBench++ هو معيار جديد تم إطلاقه بشكل مشترك في عام 2024 من قبل باحثين من جامعة تسينغهوا، وجامعة شيان جياوتونغ، وجامعة إلينوي في أوربانا شامبين، والأكاديمية الصينية للعلوم، وشركة Megvii لمعالجة المشكلات في تقييم تقنية إنشاء الصور الشخصية. ويحقق التوافق العميق والتقييم الآلي مع التفضيلات البشرية من خلال تقديم GPT-4o المتعدد الوسائط، ويطلق مجموعة بيانات أكثر شمولاً وتنوعًا.

الاستخدام المباشر:https://go.hyper.ai/glVDV

9. قاعدة بيانات الأشعة السينية لكوفيد-19 قاعدة بيانات صور الأشعة السينية للصدر

تحتوي مجموعة البيانات على 3616 حالة إيجابية لمرض كوفيد-19، و10192 حالة طبيعية، و6012 حالة عتامة الرئة (عدوى رئة غير مرتبطة بكوفيد-19)، و1345 صورة للالتهاب الرئوي الفيروسي وصور قناع الرئة المقابلة لمساعدة الباحثين في إجراء أبحاثهم أثناء جائحة كوفيد-19.

الاستخدام المباشر:https://go.hyper.ai/89Wxz

10. مجموعة بيانات أوامر نموذج المحيط الكبير من Oceanlnstruct

تحتوي مجموعة البيانات على 20 ألف تعليمة وهي مصممة لتوفير بيانات التدريب لنماذج اللغة واسعة النطاق في المجال البحري. تغطي هذه التعليمات مجموعة واسعة من المعرفة في مجال العلوم البحرية، مما يضمن أن النموذج لديه قدرات احترافية في الإجابة على أسئلة العلوم البحرية، وتوليد المحتوى، وقدرات الذكاء المتجسد تحت الماء.

الاستخدام المباشر:https://go.hyper.ai/WuYlv

لمزيد من مجموعات البيانات العامة، يرجى زيارة:

https://hyper.ai/datasets

دروس تعليمية عامة مختارة

1. البرنامج التعليمي عبر الإنترنت | Stable Diffusion 3 Medium أصبح الآن مفتوح المصدر، ابدأ رحلتك الإبداعية بنقرة واحدة!

يتمتع نموذج Stable Diffusion 3 Medium (SD3) مفتوح المصدر من شركة Stability AI، الرائدة في مجال معالجة الصور، بتحسينات كبيرة في جودة الصورة وفهم المطالبات المعقدة وكفاءة الموارد. يمكنه إنشاء صور بتفاصيل واقعية وألوان زاهية وإضاءة طبيعية، ويمكنه التكيف مع مجموعة متنوعة من الأساليب! يجمع البرنامج التعليمي بين إمكانيات النص والصورة في SD3 مع سير عمل ComfyUI، مما يسمح لك ببدء رحلتك الإبداعية على الفور.

تشغيل عبر الإنترنت:https://go.hyper.ai/ojO3g

2. نموذج تجريبي كبير من Kolors Kuaishou للنص والصورة

Kolors هو نموذج واسع النطاق لتوليد النصوص إلى الصور يعتمد على الانتشار الكامن تم تطويره بواسطة فريق Kuaishou Kolors. تم تدريب Kolors على مليارات أزواج النصوص والصور، ويوضح مزايا كبيرة مقارنة بالنماذج مفتوحة المصدر والمغلقة المصدر من حيث الجودة البصرية، ودقة الدلالات المعقدة، وتقديم النصوص لكل من الأحرف الصينية والإنجليزية. لا يتطلب هذا البرنامج التعليمي إدخال أي أوامر، ويمكنك البدء في إنشاء الصورة على الفور باستخدام الاستنساخ بنقرة واحدة.

تشغيل عبر الإنترنت:https://go.hyper.ai/ur8q7

3. النشر بنقرة واحدة Mistral-Nemo-Instruct-2407

Mistral-Nemo-Instruct-2407 هو إصدار مُحسَّن من تعليمات Mistral-Nemo-Base-2407 التي تم توفيرها بشكل مشترك من خلال مصدر مفتوح بواسطة Mistral AI وNVIDIA، كما أن أداؤه أفضل بشكل ملحوظ من النماذج الأصغر أو ذات الحجم المماثل الموجودة. يحتوي Mistral NeMo على 12 مليار (12B) معلمة ونافذة سياقية تبلغ 128 ألفًا، كما أن المنطق والمعرفة العالمية ودقة التشفير الخاصة به رائدة في نطاق مماثل. يعد هذا البرنامج التعليمي نشرًا بنقرة واحدة لـ Mistral-Nemo-Instruct-2407. تم تثبيت البيئة والتبعيات ذات الصلة. كل ما عليك فعله هو استنساخه لتجربة المنطق.

تشغيل عبر الإنترنت:https://go.hyper.ai/zGkci

مقالات المجتمع

1. نموذج صغير، إنجاز كبير! تتمكن الشبكات العصبية من رؤية التباين المكاني ووصف الظواهر الجغرافية المعقدة بدقة

في الحلقة الأولى من سلسلة البث المباشر "Meet AI4S"، كان من حسن حظ HyperAI أن تدعو دينغ جيالي، طالب الدكتوراه في الاستشعار عن بعد وأنظمة المعلومات الجغرافية في جامعة تشجيانغ. وقدم شرحًا مفصلاً وسهل الفهم لنتائج أبحاثه تحت عنوان "الشبكات العصبية تقدم تفسيرات جديدة للتباين المكاني لأسعار المساكن". هذه المقالة عبارة عن ملخص لمشاركة الدكتور دينغ.

شاهد التقرير الكامل:https://go.hyper.ai/g2fXy

2. في إطار تقديم التعلم بدون أخطاء، أصدرت جامعة هواتشونغ للعلوم والتكنولوجيا نموذج انتشار مشروط مُحسَّن لفك رموز نقوش عظام أوراكل.

استخدم فريق البحث المكون من باي شيانغ وليو يوليانغ من جامعة هواتشونغ للعلوم والتكنولوجيا، بالتعاون مع جامعة أديلايد وجامعة أنيانغ العادية وجامعة جنوب الصين للتكنولوجيا، نموذجًا توليديًا قائمًا على الصور لتدريب نموذج الانتشار المشروط (OBSD) المحسن لفك رموز نقوش عظام أوراكل، مما يوفر نهجًا جديدًا لمهمة التعرف على الحروف القديمة التي يصعب حلها باستخدام معالجة اللغة الطبيعية. تعتبر هذه المقالة تفسيرًا مفصلاً ومشاركة للأوراق ذات الصلة.

شاهد التقرير الكامل:https://go.hyper.ai/fLcZU

3. ملخص مجموعة البيانات: هل ستحقق شركة Luobota أرباحًا في العام المقبل؟ تفتح القيادة الذاتية عصرًا جديدًا من "التكامل الشامل"، وتساعد مجموعات البيانات عالية الجودة على وضع نماذج الذكاء الاصطناعي الكبيرة في السيارات

تبشر القيادة الذاتية بعصر جديد من "التكامل الشامل"، حيث تلعب مجموعات البيانات عالية الجودة دورًا مهمًا. وفي هذا الصدد، قامت HyperAI بتجميع 10 مجموعات بيانات مفتوحة المصدر شائعة الاستخدام في مجال القيادة الذاتية لكي يتمكن الجميع من جمعها واستخدامها.

شاهد التقرير الكامل:https://go.hyper.ai/5nj1s

4. تم اختياره لـ ACL 2024! جامعة تشجيانغ تطلق أول نموذج للغة المحيط OceanGPT، مما يجعل الذكاء المتجسد تحت الماء حقيقة واقعة

اقترح فريق Zhang Ningyu وChen Huajun من كلية علوم الكمبيوتر والتكنولوجيا بجامعة Zhejiang أول نموذج لغوي كبير في مجال المحيطات، OceanGPT، والذي يمكنه الإجابة على الأسئلة بناءً على تعليمات علماء المحيطات واكتسب قدرات ذكاء مجسدة أولية في الهندسة البحرية. تعتبر هذه المقالة تفسيرًا مفصلاً ومشاركة للأوراق ذات الصلة.

شاهد التقرير الكامل:https://go.hyper.ai/b6tqu

مقالات موسوعية شعبية

1. قانون القياس

2. نمذجة اللغة المقنعة (MLM)

3. زيادة البيانات

4. الذاكرة طويلة المدى الذاكرة قصيرة المدى

5. الشبكة العصبية الكمومية

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة

* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 100 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai