أصبحت أكبر مجموعة بيانات لتجزئة الفيديو الخاصة بشركة Meta متاحة الآن على الإنترنت، وهي أكبر بـ 50 مرة من مجموعات البيانات المماثلة؛ لقد حصل على 9 آلاف نجمة! تبدأ النسخة التجريبية من Kuaishou Digital Human بنقرة واحدة!

كيف تعمل الذكاء الاصطناعي على إضفاء الحيوية على الصور الثابتة، وتجعل ابتساماتها، ورمشاتها، وحتى تعبيرات الوجه الدقيقة تبدو حية؟ في الآونة الأخيرة، قام فريق Kuaishou بإصدار LivePortrait مفتوح المصدر. كل ما عليك فعله هو تحميل صورة ثابتة ويمكن تحويلها إلى صورة ديناميكية ذات تعبيرات غنية. لقد حصل بالفعل على 9 آلاف نجمة على GitHub.هذا البرنامج التعليمي متاح الآن على HyperAI. تعالوا وجربوها الآن!
صورة حية رابط البرنامج التعليمي:
من 29 يوليو إلى 2 أغسطس، تحديثات الموقع الرسمي لـhyper.ai:
* مجموعات البيانات العامة عالية الجودة: 11
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3
* اختيار المقالات المجتمعية: 4 مقالات
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات مع الموعد النهائي في أغسطس: 4
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات تجزئة الفيديو SA-V
مجموعة بيانات SA-V عبارة عن مجموعة بيانات تجزئة فيديو واسعة النطاق تم إنشاؤها بواسطة Meta في عام 2024 لتدريب وتقييم Meta Segment Anything Model 2. تحتوي على ما يقرب من 51000 مقطع فيديو في العالم الحقيقي و643 ألف تعليق توضيحي للقناع المكاني الزمني، وهو أكبر بحوالي 50 مرة من مجموعات البيانات المماثلة الأخرى.
الاستخدام المباشر:https://go.hyper.ai/X4DGI
2. مجموعة بيانات معايير مختبر الأحياء: تغطي 8 مهام رئيسية وأكثر من 2.4 ألف سؤال اختيار من متعدد
لتعزيز التطوير الفعال لأنظمة الذكاء الاصطناعي في مجال علم الأحياء، أطلق باحثون من FutureHouse Inc. مجموعة بيانات LAB-Bench لعلم الأحياء الوكيل اللغوي، والتي تستخدم لتقييم أداء أنظمة الذكاء الاصطناعي في البحث البيولوجي الفعلي مثل استرجاع الأدبيات والاستدلال، وتفسير الرسوم البيانية، وفهم ومعالجة تسلسل الحمض النووي والبروتين. وقد تم تقديم النتائج إلى المؤتمر الرائد NeurlPS 2024.
الاستخدام المباشر:https://go.hyper.ai/UznkS
٣. مجموعة بيانات أسئلة مسابقة الرياضيات NuminaMath-CoT
تحتوي مجموعة البيانات على أكثر من 860 ألف زوج من أسئلة وحلول المسابقات في الرياضيات، يستخدم كل منها قالب الاستدلال بسلسلة الأفكار (CoT). تتضمن مصادر مجموعة البيانات تمارين الرياضيات في المدارس الثانوية الصينية، وأسئلة مسابقة أولمبياد الرياضيات الأمريكية والدولية. تم جمع البيانات بشكل أساسي من ملفات PDF الخاصة بأوراق الامتحانات عبر الإنترنت ومنتديات مناقشة الرياضيات.
الاستخدام المباشر:https://go.hyper.ai/svElx
4. مجموعة بيانات مراجعات الألعاب من Taptap
تحتوي مجموعة البيانات هذه على مراجعات مُصنفة لنحو 300 لعبة على تطبيق الألعاب المحمولة TapTap، بإجمالي 4888 مثالاً للبيانات، والتي يمكن استخدامها لمهام تحليل المشاعر. ومن بينها، تم اعتبار تقييمات المستخدمين التي كانت أقل من 3 نجوم (بحد أقصى 5 نجوم) على أنها 0 (غير راضٍ)، وكانت التقييمات الأخرى 1 (راضٍ). وتبلغ نسبة هاتين الفئتين تقريبًا 1:1.
الاستخدام المباشر:https://go.hyper.ai/ISf7c
5. مجموعة بيانات CCPD - مجموعة بيانات الكشف عن لوحات الترخيص الصينية
مجموعة بيانات CCPD عبارة عن مجموعة بيانات التعرف على لوحات الترخيص كبيرة ومتنوعة وموضحة بعناية. تم جمع مجموعة البيانات بشكل أساسي في مواقف السيارات في هيفاي، الصين، وتحتوي على صور لوحات الترخيص في مجموعة متنوعة من البيئات المعقدة، مثل الضبابية، والميل، والأيام الممطرة والثلجية، مما يجعل مجموعة البيانات أكثر تحديًا في مهمة التعرف على لوحات الترخيص.
الاستخدام المباشر:https://go.hyper.ai/gZ37Y
6. مجموعة بيانات توليف القصص القصيرة TinyStories
هذه المجموعة من البيانات عبارة عن مجموعة بيانات مركبة من القصص القصيرة التي تم إنشاؤها بواسطة GPT-3.5 وGPT-4، والمفردات الواردة فيها تقتصر على نطاق فهم الأطفال الذين تتراوح أعمارهم بين 3 إلى 4 سنوات. يمكن استخدام مجموعة البيانات هذه لتدريب النماذج لتوليد قصص قصيرة سلسة ومتسقة ومتنوعة وتتمتع بقواعد نحوية شبه مثالية.
الاستخدام المباشر:https://go.hyper.ai/m9ouS
7. مجموعة بيانات الكشف عن دخان حرائق الغابات
تم إصدار مجموعة البيانات هذه بشكل مشترك من قبل AI for Mankind وHPWREN في عام 2019. تحتوي على إجمالي 737 صورة، بما في ذلك 516 صورة تدريبية، و147 صورة تحقق، و74 صورة اختبار، وكان تنسيق الشرح هو COCO. يهدف إلى تحسين قدرة النموذج على التمييز بين السحابة/الضباب والدخان وإنشاء حلقة تغذية مرتدة من البداية إلى النهاية.
الاستخدام المباشر:https://go.hyper.ai/ofGHZ
هذه مجموعة بيانات كلامية متاحة للمجال العام وتتكون من 13100 مقطع صوتي قصير يقرأ فيه متحدث واحد مقاطع من 7 كتب غير خيالية. يتم توفير النسخ لكل جزء. وتراوحت مدة المقاطع بين 1 إلى 10 ثوان، بإجمالي مدة 24 ساعة تقريبًا.
الاستخدام المباشر:https://go.hyper.ai/Eo1bK
تحتوي مجموعة البيانات على 8,508 صورة لفئات الأبراج الصينية الاثنتي عشرة. تم تقسيم مجموعة البيانات مسبقًا إلى تدريب، وتحقق، واختبار بنسبة 85:7.5:7.5.
الاستخدام المباشر:https://go.hyper.ai/ps2es
10. مجموعة بيانات ضبط الرقابة القانونية الصينية عالية الجودة DISC-Law-SFT
تحتوي مجموعة البيانات هذه على ما يقرب من 300000 بيانات تدريبية وهي مصممة خصيصًا للمجال القانوني الصيني. ويهدف إلى تحسين قدرات النموذج في معالجة النصوص القانونية والتفكير المنطقي القانوني واسترجاع المعرفة والامتثال في المجال القضائي.
الاستخدام المباشر:https://go.hyper.ai/zh9Ij
11. مجموعة بيانات التعرف الرقمي الصوتي (FSDD)
مجموعة بيانات الأرقام المنطوقة المجانية (FSDD) عبارة عن مجموعة بيانات صوتية تتكون من تسجيلات صوتية رقمية في ملفات wav بمعدل أخذ عينات يبلغ 8 كيلو هرتز. تم تحرير التسجيلات لتقليل الصمت في البداية والنهاية.
الاستخدام المباشر:https://go.hyper.ai/HZ00d
لمزيد من مجموعات البيانات العامة، يرجى زيارة:
دروس تعليمية عامة مختارة
HiDiffusion هو إطار عمل عالي الدقة مفتوح المصدر تم تطويره بواسطة Megvii Technology. إنه لا يدعم الصور المولدة بالنصوص والصور المولدة بالصور فحسب، بل يتمتع أيضًا بإمكانيات استعادة الصور. أطلقت HyperAI Super Neural الآن البرنامج التعليمي "يمكن لـ HiDiffusion إنشاء صورة 8K عالية الجودة بسرعة". لا تحتاج إلى إدخال أي أوامر، فقط قم باستنساخه بنقرة واحدة للبدء.
تشغيل عبر الإنترنت:https://go.hyper.ai/yZ5K5
2. LivePortrait Kuaishou، فيديو رقمي مُولّد من الصور مفتوح المصدر، يُظهر أشخاصًا حقيقيين
LivePortrait هو إطار عمل لإنشاء مقاطع فيديو بورتريه. تتضمن وظائفه الرئيسية إنشاء رسوم متحركة حية من صورة واحدة، والتحكم بدقة في حركات العينين والشفتين، ومعالجة الخياطة السلسة للصور المتعددة، ودعم الصور متعددة الأنماط، وإنشاء رسوم متحركة عالية الدقة، وما إلى ذلك. هذا البرنامج التعليمي هو عرض توضيحي لتشغيل LivePortrait بنقرة واحدة. تم تثبيت البيئة والتبعيات ذات الصلة. يمكنك تجربته عن طريق استنساخه وبدء تشغيله بنقرة واحدة.
تشغيل عبر الإنترنت:https://go.hyper.ai/oTs66
3. عرض توضيحي لتكبير الصور فائقة الدقة المستندة إلى AuraSR GAN
AuraSR هو نموذج استعادة صور عالية الدقة يعتمد على التعلم العميق والذي يمكنه التعرف بشكل ذكي على المعلومات التفصيلية في الصور واستكمال التفاصيل المفقودة تلقائيًا أثناء تكبير الصور. بالمقارنة مع طرق تكبير الصور التقليدية، فإن AuraSR لا ينتج نتائج أفضل فحسب، بل إنه سهل الاستخدام أيضًا ويمكن استخدامه بسهولة دون مهارات احترافية. استمتع بتجربة النموذج من خلال الاستنساخ بنقرة واحدة.
تشغيل عبر الإنترنت:https://go.hyper.ai/y2wIU
مقالات المجتمع
أعلنت شركة Aitomatic، الشركة الرائدة في مجال ابتكار الذكاء الاصطناعي في القطاع الصناعي، عن إطلاق SemiKong، أول نموذج لغة كبيرة مفتوح المصدر للذكاء الاصطناعي في العالم مصمم خصيصًا لصناعة أشباه الموصلات. وكانت الشركة قد أطلقت في وقت سابق وكيل الذكاء الاصطناعي المسمى aiKO، والذي يبني وكلاء حصريين لمستخدمي الشركات بناءً على خبرتهم وبياناتهم، ويمنح الشركات "الملكية الكاملة" لوكلائها.
شاهد التقرير الكامل:https://go.hyper.ai/A7eCi
2. أبرز الأحداث: "محادثة القرن" بين هوانغ رينكسون وزوكربيرج
في الصباح الباكر من يوم 30 يوليو، في مؤتمر SIGGRAPH للرسومات الحادي والخمسين، أجرى مؤسس شركة Nvidia والرئيس التنفيذي هوانغ رينكسون ومؤسس شركة Meta والرئيس التنفيذي مارك زوكربيرج "محادثة ساخنة". قامت شركة HyperAI بتجميع أهم الأحداث والترجمات الصينية الكاملة للفيديو.
شاهد التقرير الكامل:https://go.hyper.ai/rbU2u
قام فريق البحث في معهد ماساتشوستس للتكنولوجيا بإعادة استخدام المتنبئين ذوي الحالة الواحدة عالية الدقة مثل AlphaFold وESMFold وقاموا بضبطها في إطار مطابقة التدفق المخصص للحصول على نماذج توليد بنية البروتين المشروطة بالتسلسل، والتي تسمى AlphaFLOW وESMFLOW. تعتبر هذه المقالة تفسيرًا مفصلاً ومشاركة للأوراق ذات الصلة.
شاهد التقرير الكامل:https://go.hyper.ai/qupG9
اقترح مختبر نموذج الحياة الأساسي التابع لقسم الأتمتة في جامعة تسينغهوا، بالتعاون مع مستشفى شيانغيا بجامعة سنترال ساوث، نموذجًا أساسيًا دقيقًا للذكاء الاصطناعي للتشخيص المرضي ROAM يعتمد على المصالح الإقليمية الكبيرة ومحول الهرم، والذي يستخدم للتشخيص على المستوى السريري واكتشاف العلامات الجزيئية للأورام الدبقية، ويمكن توسيعه إلى التشخيص المرضي لأنواع أخرى من الأورام.
شاهد التقرير الكامل:https://go.hyper.ai/w4tsr
مقالات موسوعية شعبية
1. مجال الإشعاع العصبي (NeRF)
2. مجموعة استعلام الاهتمام GQA
3. زيادة البيانات
4. فهم اللغة متعدد المهام على نطاق واسع (MMLU)
5. الذاكرة طويلة المدى
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة
* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: