HyperAI

أصبحت أكبر مجموعة بيانات لتجزئة الفيديو الخاصة بشركة Meta متاحة الآن على الإنترنت، وهي أكبر بـ 50 مرة من مجموعات البيانات المماثلة؛ لقد حصل على 9 آلاف نجمة! تبدأ النسخة التجريبية من Kuaishou Digital Human بنقرة واحدة!

特色图像

كيف تعمل الذكاء الاصطناعي على إضفاء الحيوية على الصور الثابتة، وتجعل ابتساماتها، ورمشاتها، وحتى تعبيرات الوجه الدقيقة تبدو حية؟ في الآونة الأخيرة، قام فريق Kuaishou بإصدار LivePortrait مفتوح المصدر. كل ما عليك فعله هو تحميل صورة ثابتة ويمكن تحويلها إلى صورة ديناميكية ذات تعبيرات غنية. لقد حصل بالفعل على 9 آلاف نجمة على GitHub.هذا البرنامج التعليمي متاح الآن على HyperAI. تعالوا وجربوها الآن!

صورة حية  رابط البرنامج التعليمي:

https://go.hyper.ai/oTs66

من 29 يوليو إلى 2 أغسطس، تحديثات الموقع الرسمي لـhyper.ai:

* مجموعات البيانات العامة عالية الجودة: 11

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3

* اختيار المقالات المجتمعية: 4 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات مع الموعد النهائي في أغسطس: 4

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات تجزئة الفيديو SA-V

مجموعة بيانات SA-V عبارة عن مجموعة بيانات تجزئة فيديو واسعة النطاق تم إنشاؤها بواسطة Meta في عام 2024 لتدريب وتقييم Meta Segment Anything Model 2. تحتوي على ما يقرب من 51000 مقطع فيديو في العالم الحقيقي و643 ألف تعليق توضيحي للقناع المكاني الزمني، وهو أكبر بحوالي 50 مرة من مجموعات البيانات المماثلة الأخرى.

الاستخدام المباشر:https://go.hyper.ai/X4DGI

2. مجموعة بيانات معايير مختبر الأحياء: تغطي 8 مهام رئيسية وأكثر من 2.4 ألف سؤال اختيار من متعدد

لتعزيز التطوير الفعال لأنظمة الذكاء الاصطناعي في مجال علم الأحياء، أطلق باحثون من FutureHouse Inc. مجموعة بيانات LAB-Bench لعلم الأحياء الوكيل اللغوي، والتي تستخدم لتقييم أداء أنظمة الذكاء الاصطناعي في البحث البيولوجي الفعلي مثل استرجاع الأدبيات والاستدلال، وتفسير الرسوم البيانية، وفهم ومعالجة تسلسل الحمض النووي والبروتين. وقد تم تقديم النتائج إلى المؤتمر الرائد NeurlPS 2024.

الاستخدام المباشر:https://go.hyper.ai/UznkS

٣. مجموعة بيانات أسئلة مسابقة الرياضيات NuminaMath-CoT

تحتوي مجموعة البيانات على أكثر من 860 ألف زوج من أسئلة وحلول المسابقات في الرياضيات، يستخدم كل منها قالب الاستدلال بسلسلة الأفكار (CoT). تتضمن مصادر مجموعة البيانات تمارين الرياضيات في المدارس الثانوية الصينية، وأسئلة مسابقة أولمبياد الرياضيات الأمريكية والدولية. تم جمع البيانات بشكل أساسي من ملفات PDF الخاصة بأوراق الامتحانات عبر الإنترنت ومنتديات مناقشة الرياضيات.

الاستخدام المباشر:https://go.hyper.ai/svElx

4. مجموعة بيانات مراجعات الألعاب من Taptap

تحتوي مجموعة البيانات هذه على مراجعات مُصنفة لنحو 300 لعبة على تطبيق الألعاب المحمولة TapTap، بإجمالي 4888 مثالاً للبيانات، والتي يمكن استخدامها لمهام تحليل المشاعر. ومن بينها، تم اعتبار تقييمات المستخدمين التي كانت أقل من 3 نجوم (بحد أقصى 5 نجوم) على أنها 0 (غير راضٍ)، وكانت التقييمات الأخرى 1 (راضٍ). وتبلغ نسبة هاتين الفئتين تقريبًا 1:1.

الاستخدام المباشر:https://go.hyper.ai/ISf7c

5. مجموعة بيانات CCPD - مجموعة بيانات الكشف عن لوحات الترخيص الصينية

مجموعة بيانات CCPD عبارة عن مجموعة بيانات التعرف على لوحات الترخيص كبيرة ومتنوعة وموضحة بعناية. تم جمع مجموعة البيانات بشكل أساسي في مواقف السيارات في هيفاي، الصين، وتحتوي على صور لوحات الترخيص في مجموعة متنوعة من البيئات المعقدة، مثل الضبابية، والميل، والأيام الممطرة والثلجية، مما يجعل مجموعة البيانات أكثر تحديًا في مهمة التعرف على لوحات الترخيص.

الاستخدام المباشر:https://go.hyper.ai/gZ37Y

6. مجموعة بيانات توليف القصص القصيرة TinyStories

هذه المجموعة من البيانات عبارة عن مجموعة بيانات مركبة من القصص القصيرة التي تم إنشاؤها بواسطة GPT-3.5 وGPT-4، والمفردات الواردة فيها تقتصر على نطاق فهم الأطفال الذين تتراوح أعمارهم بين 3 إلى 4 سنوات. يمكن استخدام مجموعة البيانات هذه لتدريب النماذج لتوليد قصص قصيرة سلسة ومتسقة ومتنوعة وتتمتع بقواعد نحوية شبه مثالية.

الاستخدام المباشر:https://go.hyper.ai/m9ouS

7. مجموعة بيانات الكشف عن دخان حرائق الغابات

تم إصدار مجموعة البيانات هذه بشكل مشترك من قبل AI for Mankind وHPWREN في عام 2019. تحتوي على إجمالي 737 صورة، بما في ذلك 516 صورة تدريبية، و147 صورة تحقق، و74 صورة اختبار، وكان تنسيق الشرح هو COCO. يهدف إلى تحسين قدرة النموذج على التمييز بين السحابة/الضباب والدخان وإنشاء حلقة تغذية مرتدة من البداية إلى النهاية.

الاستخدام المباشر:https://go.hyper.ai/ofGHZ

8. مجموعة بيانات LJSpeech

هذه مجموعة بيانات كلامية متاحة للمجال العام وتتكون من 13100 مقطع صوتي قصير يقرأ فيه متحدث واحد مقاطع من 7 كتب غير خيالية. يتم توفير النسخ لكل جزء. وتراوحت مدة المقاطع بين 1 إلى 10 ثوان، بإجمالي مدة 24 ساعة تقريبًا.

الاستخدام المباشر:https://go.hyper.ai/Eo1bK

9. علامات الأبراج الصينية

تحتوي مجموعة البيانات على 8,508 صورة لفئات الأبراج الصينية الاثنتي عشرة. تم تقسيم مجموعة البيانات مسبقًا إلى تدريب، وتحقق، واختبار بنسبة 85:7.5:7.5.

الاستخدام المباشر:https://go.hyper.ai/ps2es

10. مجموعة بيانات ضبط الرقابة القانونية الصينية عالية الجودة DISC-Law-SFT

تحتوي مجموعة البيانات هذه على ما يقرب من 300000 بيانات تدريبية وهي مصممة خصيصًا للمجال القانوني الصيني. ويهدف إلى تحسين قدرات النموذج في معالجة النصوص القانونية والتفكير المنطقي القانوني واسترجاع المعرفة والامتثال في المجال القضائي.

الاستخدام المباشر:https://go.hyper.ai/zh9Ij

11. مجموعة بيانات التعرف الرقمي الصوتي (FSDD)

مجموعة بيانات الأرقام المنطوقة المجانية (FSDD) عبارة عن مجموعة بيانات صوتية تتكون من تسجيلات صوتية رقمية في ملفات wav بمعدل أخذ عينات يبلغ 8 كيلو هرتز. تم تحرير التسجيلات لتقليل الصمت في البداية والنهاية.

الاستخدام المباشر:https://go.hyper.ai/HZ00d

لمزيد من مجموعات البيانات العامة، يرجى زيارة:

https://hyper.ai/datasets

دروس تعليمية عامة مختارة

1. البرنامج التعليمي الجديد | أداة الثلاثة في واحد لتحويل النص إلى صورة، وتحويل الصورة إلى صورة، واستعادة الصورة، برنامج تعليمي للبدء بنقرة واحدة من HiDiffusion متاح الآن عبر الإنترنت!

HiDiffusion هو إطار عمل عالي الدقة مفتوح المصدر تم تطويره بواسطة Megvii Technology. إنه لا يدعم الصور المولدة بالنصوص والصور المولدة بالصور فحسب، بل يتمتع أيضًا بإمكانيات استعادة الصور. أطلقت HyperAI Super Neural الآن البرنامج التعليمي "يمكن لـ HiDiffusion إنشاء صورة 8K عالية الجودة بسرعة". لا تحتاج إلى إدخال أي أوامر، فقط قم باستنساخه بنقرة واحدة للبدء.

تشغيل عبر الإنترنت:https://go.hyper.ai/yZ5K5

2. LivePortrait Kuaishou، فيديو رقمي مُولّد من الصور مفتوح المصدر، يُظهر أشخاصًا حقيقيين

LivePortrait هو إطار عمل لإنشاء مقاطع فيديو بورتريه. تتضمن وظائفه الرئيسية إنشاء رسوم متحركة حية من صورة واحدة، والتحكم بدقة في حركات العينين والشفتين، ومعالجة الخياطة السلسة للصور المتعددة، ودعم الصور متعددة الأنماط، وإنشاء رسوم متحركة عالية الدقة، وما إلى ذلك. هذا البرنامج التعليمي هو عرض توضيحي لتشغيل LivePortrait بنقرة واحدة. تم تثبيت البيئة والتبعيات ذات الصلة. يمكنك تجربته عن طريق استنساخه وبدء تشغيله بنقرة واحدة.

تشغيل عبر الإنترنت:https://go.hyper.ai/oTs66

3. عرض توضيحي لتكبير الصور فائقة الدقة المستندة إلى AuraSR GAN

AuraSR هو نموذج استعادة صور عالية الدقة يعتمد على التعلم العميق والذي يمكنه التعرف بشكل ذكي على المعلومات التفصيلية في الصور واستكمال التفاصيل المفقودة تلقائيًا أثناء تكبير الصور. بالمقارنة مع طرق تكبير الصور التقليدية، فإن AuraSR لا ينتج نتائج أفضل فحسب، بل إنه سهل الاستخدام أيضًا ويمكن استخدامه بسهولة دون مهارات احترافية. استمتع بتجربة النموذج من خلال الاستنساخ بنقرة واحدة.

تشغيل عبر الإنترنت:https://go.hyper.ai/y2wIU

مقالات المجتمع

1. أصدرت شركة Aitomatic، بمساهمات من Meta وTokyo Electron وFPT Software وغيرها، أول نموذج مفتوح المصدر في صناعة أشباه الموصلات، مما أدى إلى "قفل" الاستقلال التكنولوجي للمؤسسات.

أعلنت شركة Aitomatic، الشركة الرائدة في مجال ابتكار الذكاء الاصطناعي في القطاع الصناعي، عن إطلاق SemiKong، أول نموذج لغة كبيرة مفتوح المصدر للذكاء الاصطناعي في العالم مصمم خصيصًا لصناعة أشباه الموصلات. وكانت الشركة قد أطلقت في وقت سابق وكيل الذكاء الاصطناعي المسمى aiKO، والذي يبني وكلاء حصريين لمستخدمي الشركات بناءً على خبرتهم وبياناتهم، ويمنح الشركات "الملكية الكاملة" لوكلائها.

شاهد التقرير الكامل:https://go.hyper.ai/A7eCi

2. أبرز الأحداث: "محادثة القرن" بين هوانغ رينكسون وزوكربيرج

في الصباح الباكر من يوم 30 يوليو، في مؤتمر SIGGRAPH للرسومات الحادي والخمسين، أجرى مؤسس شركة Nvidia والرئيس التنفيذي هوانغ رينكسون ومؤسس شركة Meta والرئيس التنفيذي مارك زوكربيرج "محادثة ساخنة". قامت شركة HyperAI بتجميع أهم الأحداث والترجمات الصينية الكاملة للفيديو.

شاهد التقرير الكامل:https://go.hyper.ai/rbU2u

3. تم اختياره للحصول على ICML! فريق معهد ماساتشوستس للتكنولوجيا يحقق اختراقًا جديدًا يعتمد على AlphaFold، ويكشف عن التنوع الديناميكي للبروتينات

قام فريق البحث في معهد ماساتشوستس للتكنولوجيا بإعادة استخدام المتنبئين ذوي الحالة الواحدة عالية الدقة مثل AlphaFold وESMFold وقاموا بضبطها في إطار مطابقة التدفق المخصص للحصول على نماذج توليد بنية البروتين المشروطة بالتسلسل، والتي تسمى AlphaFLOW وESMFLOW. تعتبر هذه المقالة تفسيرًا مفصلاً ومشاركة للأوراق ذات الصلة.

شاهد التقرير الكامل:https://go.hyper.ai/qupG9

4. المستوى جيد تقريبًا مثل مستوى كبار علماء الأمراض! يقترح فريق جامعة تسينغهوا نموذج ROAM القائم على الذكاء الاصطناعي لتحقيق التشخيص الدقيق للورم الدبقي

اقترح مختبر نموذج الحياة الأساسي التابع لقسم الأتمتة في جامعة تسينغهوا، بالتعاون مع مستشفى شيانغيا بجامعة سنترال ساوث، نموذجًا أساسيًا دقيقًا للذكاء الاصطناعي للتشخيص المرضي ROAM يعتمد على المصالح الإقليمية الكبيرة ومحول الهرم، والذي يستخدم للتشخيص على المستوى السريري واكتشاف العلامات الجزيئية للأورام الدبقية، ويمكن توسيعه إلى التشخيص المرضي لأنواع أخرى من الأورام.

شاهد التقرير الكامل:https://go.hyper.ai/w4tsr

مقالات موسوعية شعبية

1. مجال الإشعاع العصبي (NeRF)

2. مجموعة استعلام الاهتمام GQA

3. زيادة البيانات

4. فهم اللغة متعدد المهام على نطاق واسع (MMLU)

5. الذاكرة طويلة المدى

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة

* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 100 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai