تجربة أحدث إصدار من Gradio 5 بسرعة! يُستخدم من قبل أكثر من 2 مليون مستخدم؛ تم اختيارهم لمجموعة بيانات تحسين الصور في الإضاءة المنخفضة لـ ACCV'24 LoLI-Street عبر الإنترنت

منذ إطلاقه، يستخدم Gradio أكثر من 2 مليون مستخدم شهريًا ويلعب دورًا رئيسيًا في نظام تطوير الذكاء الاصطناعي. بفضل الكود الموجز والواجهة البديهية، من السهل تحويل نماذج التعلم الآلي المعقدة إلى تطبيقات ويب سهلة الاستخدام مع ضمان أمان التطبيقات وإمكانية الوصول إليها.
أصدر فريق Gradio مؤخرًا الإصدار الأحدث، وهو الإصدار المستقر Gradio 5، والذي قام بإجراء ترقيات كبيرة في التطبيقات في الوقت الفعلي ووسائط البث، مع زمن انتقال أقل وتجربة أكثر سلاسة.من أجل السماح للجميع بتجربة التحسينات التقنية لـ Gradio 5 في وقت مبكر وبشكل أكثر ملاءمة، يستخدم الموقع الرسمي لـ hyper.ai Gradio لنشر برنامجين تعليميين شائعين، يمكن استنساخهما واستخدامهما بنقرة واحدة:
1. يقوم Depth Pro بإنشاء خرائط عمق ثلاثية الأبعاد على الفور
تشغيل عبر الإنترنت:https://go.hyper.ai/bSp3h
2. يُنشئ Pyramid Flow عرضًا توضيحيًا للفيديو عالي الدقة في دقيقة واحدة
تشغيل عبر الإنترنت:https://go.hyper.ai/njiHn
من 21 أكتوبر إلى 25 أكتوبر، تحديثات الموقع الرسمي لـ hyper.ai:
* دروس تعليمية مختارة عالية الجودة: 2
* مجموعات البيانات العامة عالية الجودة: 10
* اختيار المقالات المجتمعية: 4 مقالات
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات ذات المواعيد النهائية في نوفمبر: 7
قم بزيارة الموقع الرسمي:هايبر.اي
دروس تعليمية عامة مختارة
1. يقوم Depth Pro بإنشاء خرائط عمق ثلاثية الأبعاد على الفور
Depth Pro هو نموذج أساسي لتقدير العمق أحادي العين مفتوح المصدر بدون لقطة يمكنه إنشاء خرائط عمق ثلاثية الأبعاد عالية الدقة بسرعة من صورة ثنائية الأبعاد واحدة. لا يعد هذا النموذج سريعًا فحسب، حيث يستغرق 0.3 ثانية فقط، بل يوفر أيضًا معلومات العمق على مستوى القياس، كما أن خرائط العمق المولدة لها مقياس في العالم الحقيقي. يمكن لهذا المشروع إنشاء واجهة تفاعلية أمامية من خلال واجهة Gradio. تم نشر النماذج والتبعيات ذات الصلة ويمكن استنساخها بنقرة واحدة لتجربتها.
تشغيل عبر الإنترنت:https://go.hyper.ai/bSp3h

2. يُنشئ Pyramid Flow عرضًا توضيحيًا للفيديو عالي الدقة في دقيقة واحدة
Pyramid Flow هو نموذج مفتوح المصدر لتوليد فيديو عالي الدقة. يمكن لهذا النموذج إنشاء مقاطع فيديو عالية الجودة بحد أقصى يبلغ 10 ثوانٍ، ودقة تصل إلى 1280×768، ومعدل إطارات يبلغ 24 إطارًا في الثانية بناءً على أوصاف النص. تعتمد التكنولوجيا الأساسية فيها على خوارزمية مطابقة تدفق الهرم، والتي تعمل على تقسيم عملية إنشاء الفيديو إلى مراحل متعددة بدقة مختلفة، وبالتالي تحسين كفاءة الإنتاج والجودة. قم بتشغيل الحاوية وفقًا للبرنامج التعليمي وانسخ عنوان API مباشرةً لتوليد فيديو عالي الدقة.
تشغيل عبر الإنترنت:https://go.hyper.ai/njiHn

💡لقد قمنا أيضًا بتأسيس مجموعة تبادل تعليمية حول الانتشار المستقر. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة والتعليق على [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق ~

مجموعات البيانات العامة المختارة
1. مجموعة بيانات تحسين الصور منخفضة الإضاءة LoLI-Street
تتكون مجموعة البيانات هذه من 33 ألف زوج من الصور ذات الإضاءة المنخفضة والمعرضة جيدًا من مشاهد الشوارع الحضرية المتطورة، والتي تغطي 19 ألف فئة من الكائنات للكشف عن الكائنات. كما أنه يتضمن 1000 صورة اختبار إضاءة منخفضة حقيقية لاختبار نموذج تحسين الصورة في الإضاءة المنخفضة (LLIE) في ظل ظروف واقعية. تُعد مجموعة البيانات هذه ضرورية للعديد من مهام الرؤية الحاسوبية، بما في ذلك اكتشاف الكائنات وتتبعها وتقسيمها وفهم المشهد. وقد تم قبول النتائج ذات الصلة من قبل ACCV'24.
الاستخدام المباشر:https://go.hyper.ai/XD7kV

2. مجموعة بيانات تعلم الروبوت BC-Z
تدعم مجموعة البيانات تعميم المهام بدون أخطاء، مما يمكّن الروبوتات من أداء مهام معالجة جديدة من خلال التعلم بالتقليد دون خبرة سابقة. يحتوي على أكثر من 25 ألف سيناريو تشغيل مختلف، تغطي 100 مهمة تشغيل متنوعة.
الاستخدام المباشر:https://go.hyper.ai/Lg1GC

3. الرسم الصيني التقليدي مجموعة بيانات الرسم الصيني التقليدي
تحتوي مجموعة البيانات على 1000 صورة محتوى و 100 صورة نمطية. معظم صور المحتوى هي مشاهد حقيقية لجبال جيانغنان والبحيرات والأنهار والجسور والمباني وما إلى ذلك، والتي لا تشمل المناظر الطبيعية الصينية فحسب، بل تشمل أيضًا نهر الراين وجبال الألب ومتنزه يلوستون الوطني وجراند كانيون وغيرها من المناظر الطبيعية الجميلة.
الاستخدام المباشر:https://go.hyper.ai/wwZqs

4. مجموعة بيانات ضبط تعليمات الرياضيات OpenMathInstruct-2
تحتوي مجموعة البيانات على 14 مليون زوج من الأسئلة والأجوبة، وهي أكبر بنحو ثماني مرات من أكبر مجموعة بيانات من نوعها سابقًا. من خلال ضبط نموذج Llama-3.1-8B-Base باستخدام OpenMathInstruct-2، تم تحسين أدائه على مجموعة بيانات MATH بمقدار 15.9% مقارنة بـ Llama3.1-8B-Instruct (من 51.9% إلى 67.8%).
الاستخدام المباشر:https://go.hyper.ai/fxskH

5. مجموعة بيانات معيارية للاستدلال الرياضي Omni-MATH
تحتوي مجموعة البيانات هذه على 4428 مسألة رياضية على مستوى المنافسة تم شرحها يدويًا بدقة، وتغطي 33 مجالًا فرعيًا وأكثر من 10 مستويات صعوبة مختلفة، من مستوى التحضير للأولمبياد إلى مسابقات الرياضيات الأولمبية الكبرى مثل IMO (أولمبياد الرياضيات الدولي)، وIMC (مسابقة الرياضيات الدولية) ومسابقة بوتنام للرياضيات.
الاستخدام المباشر:https://go.hyper.ai/tYgfN

6. مجموعة بيانات قاعدة الاستدلال 20 ألف
تم تصميم مجموعة البيانات لتدريب نماذج التفكير حتى تتمكن من التفكير في المشكلات المعقدة ومن ثم الاستجابة مثل البشر. تتضمن مجموعة البيانات أسئلة متنوعة من مجالات مختلفة (العلوم، والترميز، والرياضيات، وما إلى ذلك)، كل منها مع سلسلة مفصلة من الأفكار (COT) والإجابة الصحيحة. الهدف هو تمكين النموذج من التعلم وتحسين عملية التفكير، وتحديد الأخطاء وتصحيحها، وتوفير استجابات مفصلة وعالية الجودة.
الاستخدام المباشر:https://go.hyper.ai/ssznB
7. مجموعة بيانات مسار تسمية لغة روبوت جدول اللغة
تحتوي مجموعة البيانات على ما يقرب من 600 ألف مسار مُعَلَّم باللغة لتعزيز تطوير الروبوتات الأكثر تقدمًا وكفاءة والتي يمكنها التفاعل مع اللغة الطبيعية. ومن خلال التدريب على مجموعة بيانات تضم مئات الآلاف من المسارات الموضحة لغويًا، وجد الباحثون أن السياسة الناتجة كانت قادرة على تنفيذ تعليمات أكثر بعشر مرات مما كان ممكنًا في السابق، ووصف المهارات الحركية السمعية والبصرية الشاملة في العالم الحقيقي.
الاستخدام المباشر:https://go.hyper.ai/bUPXz
8. مجموعة بيانات BridgeData V2 لتعلم الروبوتات واسعة النطاق
تم تصميم هذه البيانات لتسهيل أبحاث التعلم الروبوتي القابلة للتطوير، وتحتوي على أكثر من 60 ألف مسار روبوت تم جمعها في 24 بيئة مختلفة. ولتعزيز قدرات التعميم لدى الروبوت، جمع الباحثون كمية كبيرة من بيانات المهام في مجموعة متنوعة من البيئات مع أشياء مختلفة، ومواضع كاميرا مختلفة، ومواضع مساحة عمل مختلفة. وكان كل مسار مصحوبًا بتعليمات باللغة الطبيعية تتوافق مع مهمة الروبوت.
الاستخدام المباشر:https://go.hyper.ai/eqcYW
9. مجموعة بيانات روبوتات RT-1 في العالم الحقيقي
يتم استخدام مجموعة البيانات هذه لتدريب نموذج RT-1. تشمل المهارات عالية المستوى التي تغطيها مجموعة البيانات التقاط الأشياء ووضعها، وفتح الأدراج وإغلاقها، وإخراج الأشياء من الأدراج ووضعها فيها، ووضع الأشياء الطويلة والرفيعة في وضع مستقيم، ودفع الأشياء، وسحب المناديل، وفتح البرطمانات، وتغطي أكثر من 700 مهمة باستخدام مجموعة متنوعة من الأشياء المختلفة.
الاستخدام المباشر:https://go.hyper.ai/8ySHu
10. مجموعة بيانات الحوسبة الطبية MedCalc-Bench
تحتوي مجموعة البيانات هذه على 10,055 حالة تدريب و1,047 حالة اختبار، تغطي 55 مهمة حسابية مختلفة. يتضمن كل مثال ملاحظات المريض، وسؤالاً لحساب قيمة سريرية محددة، وقيمة الإجابة النهائية، وحلاً خطوة بخطوة. يهدف برنامج MedCalc-Bench إلى تحسين مهارات التفكير اللفظي والحسابي لحاملي شهادة الماجستير في القانون في البيئة الطبية.
الاستخدام المباشر:https://go.hyper.ai/5bhzs
لمزيد من مجموعات البيانات العامة، يرجى زيارة:
مقالات المجتمع
أطلق باحثون من جامعة توهوكو في اليابان ومعهد ماساتشوستس للتكنولوجيا أداة ذكاء اصطناعي جديدة، GNNOpt، والتي نجحت في تحديد 246 مادة ذات كفاءة تحويل طاقة شمسية تتجاوز 32% و296 مادة كمية ذات أوزان كمية عالية، مما يسرع بشكل كبير من اكتشاف الطاقة والمواد الكمية. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة البحثية.
شاهد التقرير الكامل:https://go.hyper.ai/3uRDH
سيتم عقد منتدى الذكاء الاصطناعي مفتوح المصدر لعام 2024 (الذكاء الاصطناعي من أجل العلوم) في 2 نوفمبر! في ذلك الوقت، سيركز الباحثون من العديد من الجامعات على مجالات البحث العلمي مثل الصحة الطبية، وعلوم المعلومات الجغرافية، والأنظمة المعقدة المكانية الزمنية، مما يؤدي إلى نشر التكنولوجيا بشكل متعمق وتحليل اتجاهات تطوير الصناعة من وجهات نظر مختلفة للبحث الأكاديمي وتطبيقات الصناعة.
تعرف على تفاصيل الحدث:https://go.hyper.ai/MiQ1O
اقترحت جامعة تشجيانغ ومايكروسوفت ريسيرش آسيا بشكل مشترك إطار عمل موحد جديد للتدريب المسبق على الصور الطبية UniMedI. ويستخدم التقارير التشخيصية كمساحة دلالية مشتركة لإنشاء تمثيل موحد للصور الطبية لمختلف الوسائل، ودمج الصور ثنائية وثلاثية الأبعاد بنجاح، والاستفادة بشكل أفضل من البيانات الطبية المعقدة. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.
شاهد التقرير الكامل:https://go.hyper.ai/MXYTq
في مواجهة تغير المناخ المتزايد الإلحاح، يتم تنفيذ حملة عالمية واسعة النطاق على مستوى الصناعة للحد من انبعاثات الكربون على قدم وساق. وقد انطلقت شركة CuspAI، التي تركز على استخدام الذكاء الاصطناعي لاستكشاف مواد احتجاز الكربون، بشكل أسرع. وفي 18 يونيو/حزيران من هذا العام، حصلت الشركة على جولة تمويل أولية بقيمة تصل إلى 30 مليون دولار أميركي (حوالي 217 مليون يوان صيني)، لتصبح واحدة من أكبر جولات التمويل الأولي في أوروبا في ذلك العام. ما هو الشيء الجذاب في هذه الشركة الناشئة؟ اقرأ هذا المقال وربما تجد الإجابة.
شاهد التقرير الكامل:https://go.hyper.ai/nErwd
مقالات موسوعية شعبية
1. التجميع
2. جهاز التشفير التلقائي المتغير VAE
3. الشبكة العصبية الكمومية (QNN)
4. اختبار t المقترن
5. زيادة البيانات
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
الموعد النهائي للقمة في نوفمبر

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAIهايبر.اي)
HyperAI Super Neural (هايبر.اي) هي مجتمع رائد في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة
* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: