اختيارات المحرر الأسبوعية | تقرير أصل الطبق مفتوح المصدر من Hometown Chicken، أداة SUPIR لإصلاح الصور القديمة للاستخدام عبر الإنترنت

خبر عاجل! خبر عاجل!"الوثائق السرية" للاو شيانغ جي أصبحت في الواقع متاحة للعامة!
أصدرت شركة لاو شيانغ جي مؤخرًا تقريرها "تقرير تتبع الأغذية لشركة لاو شيانغ جي" المكون من 200 ألف كلمة للجمهور، والذي ينص بوضوح على كل شيء بدءًا من مصدر المكونات وحتى تفاصيل الطهي. إنه متاح الآن للتنزيل في Chao Shen Wang، تعال وشاهد إذا كان هناك أي شيء يعجبك!
ملاحظة: المحرر يريد فقط أن يسأل، إذا فشل العمل وفقًا للتقرير، هل يمكنني تقديم مشكلة؟
من 15 أبريل إلى 19 أبريل، تحديثات الموقع الرسمي لـ hyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* دروس تعليمية مختارة عالية الجودة: 2
* اختيار المقالات المجتمعية: 3 مقالات
* إدخالات الموسوعة الشعبية: 5
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. تقرير تتبع طعام الدجاج محلي الصنع
تغطي مجموعة البيانات 1218 مطعمًا حاليًا في Lao Xiang Ji، و226 وحدة تخزين، و873 مكونًا، و305 موردين. قامت شركة لاو شيانغ جي بإتاحة تقريرها حول تتبع الأغذية والذي يتكون من 677 صفحة و200 ألف كلمة للعامة.
الاستخدام المباشر:https://go.hyper.ai/nbESl
2. مجموعة بيانات فيديو مشروع Open Sora
Open-Sora-Plan هو مشروع مفتوح المصدر يهدف إلى إعادة إنتاج Sora (نموذج T2V) الخاص بـ OpenAI. تعتبر هذه المجموعة من البيانات عبارة عن مجموعة بيانات فيديو لمشروعها. قام فريق البحث بفحص 40,258 مقطع فيديو من مواقع ويب مفتوحة المصدر بموجب ترخيص CC0. جميع مقاطع الفيديو عالية الجودة ولا تحتوي على علامة مائية، ومنها حوالي 60% هي بيانات أفقية.
الاستخدام المباشر:https://go.hyper.ai/75Ftc
3. مجموعة بيانات التقاط الحركة متعددة الوسائط MMVP
تحتوي مجموعة البيانات هذه على العديد من الحركات البشرية السريعة وواسعة النطاق، مثل الجري والقفز والقفز الطويل أثناء الوقوف، وما إلى ذلك، وتم جمع ما يزيد عن 44 ألف إطار RGBD متزامن مع الإطارات وبيانات الضغط من 16 موضوعًا.
الاستخدام المباشر: https://go.hyper.ai/4edeR
4. مجموعة بيانات تدريب الرياضيات على الويب المفتوح OpenWebMath
OpenWebMath عبارة عن مجموعة بيانات تحتوي على نصوص رياضية عالية الجودة من معظم الإنترنت. يتم تصفيته واستخراجه من أكثر من 200 مليار ملف HTML على Common Crawl، مما أدى إلى مجموعة من 6.3 مليون مستند تحتوي على إجمالي 14.7 مليار رمز. تم تصميم OpenWebMath للتدريب المسبق والضبط الدقيق لنماذج اللغة الكبيرة.
الاستخدام المباشر: https://go.hyper.ai/zjytq
5. مجموعة البيانات الرياضية Proof-Pile-2
Proof-Pile-2 عبارة عن مجموعة بيانات مميزة مكونة من 55 مليار مستند رياضي وعلمي. مزيج من الأوراق العلمية ومحتوى الويب المتعلق بالرياضيات وأكواد الرياضيات حتى أبريل 2023 (باستثناء مجموعة فرعية محددة من خطوات Lean proof). تم إنشاء مجموعة البيانات هذه لتدريب نموذجي Llemma 7B وLlemma 34B.
الاستخدام المباشر: https://go.hyper.ai/aant8
6. مجموعة بيانات الرياضيات الميزار
تحتوي مكتبة مزار للرياضيات على نظريات وإثباتات رياضية رسمية تغطي مجموعة واسعة من المجالات الرياضية بما في ذلك المنطق والجبر والتحليل والهندسة وما إلى ذلك. والهدف من هذه المكتبة هو توفير أساس رياضي متين لإثبات النظريات الآلية والاستدلال الرسمي.
الاستخدام المباشر: https://go.hyper.ai/IJeHa
7. إيزابيل باراليل كوربوس
مجموعة إيزابيل الموازية (IPC) هي مبادرة يقودها المجتمع لإنشاء مجموعة موازية من وثائق إيزابيل. يقوم IPC بمزاوجة المستندات الرسمية في لغة إيزابيل (مثل النظريات والمعضلات والتعريفات وما إلى ذلك) مع نظيراتها في اللغة الطبيعية.
الاستخدام المباشر: https://go.hyper.ai/BEADY
8. مجموعة بيانات الفواكه مجموعة بيانات تصنيف نضارة الفواكه
تحتوي مجموعة البيانات هذه على صور لثلاثة أنواع من الفاكهة: التفاح والبرتقال والموز. يتم تصنيف كل صورة وفقًا لنوع الفاكهة وحالة نضارتها، مما يتيح مهام التعلم الخاضعة للإشراف مثل التصنيف أو اكتشاف الكائنات.
الاستخدام المباشر:https://go.hyper.ai/b7TNx
9. مجموعة بيانات تصنيف صور الفاكهة DeepFruit
DeepFruit هي مجموعة بيانات لتصنيف صور الفاكهة تم إصدارها بشكل مشترك من قبل جامعة الأمير محمد بن فهد ومؤسسات بحثية أخرى. تحتوي مجموعة البيانات على 21,122 صورة فاكهة بناءً على 8 مجموعات مختلفة من الفاكهة. ويمكن استخدامه في الأبحاث في مجال اكتشاف الفاكهة وتحديدها وتصنيفها، فضلاً عن التطبيقات المبتكرة الأخرى مثل تقدير السعرات الحرارية.
الاستخدام المباشر:https://go.hyper.ai/ut4BA
10. 15 مجموعة بيانات لتصنيف صور الحيوانات
تحتوي مجموعة البيانات على مجلدات صور لـ 15 حيوانًا، جميع الصور بحجم 224 × 224، وهي مناسبة لتصنيف الصور. تم تنزيل الصور من الإنترنت ومعالجتها مسبقًا (تغيير الحجم وتحسين الجودة) باستخدام مكتبة OpenCV. لذلك، يمكن استخدام هذه المجموعة من البيانات بشكل مباشر للتدريب دون الحاجة إلى زيادة البيانات بشكل أكبر.
الاستخدام المباشر:https://go.hyper.ai/tgMtH
لمزيد من مجموعات البيانات العامة، يرجى زيارة:
دروس تعليمية عامة مختارة
تستخدم أداة استعادة الصور SUPIR تقنية StableDiffusion-XL (SDXL) وتوسيع النموذج، ويمكنها تحسين جودة استعادة الصور بشكل كبير من خلال التعلم الآلي والطرق المتعددة الوسائط. لقد بنى هذا البرنامج التعليمي بيئة مناسبة للجميع. بدون أي تحضيرات أولية معقدة، يمكنك إصلاح الصورة بنقرة واحدة.
تشغيل عبر الإنترنت:https://go.hyper.ai/3RBMH
2. نشر نماذج كبيرة باستخدام Ollama و Open WebUI
هذا البرنامج التعليمي عبارة عن حزمة تشغيل بنقرة واحدة من Ollama + Open WebUI. كل ما عليك فعله هو اتباع الخطوات وإدخال الأوامر لتشغيل النموذج الكبير. النماذج المضمنة حاليًا هي: qwen 1.5 14b، qwen 1.5 32b، llava 1.6 34b، ودعم تحميل نماذج جديدة بنفسك.
تشغيل عبر الإنترنت:https://go.hyper.ai/FwREK
مقالات المجتمع
اقترحت مجموعة البحث بقيادة الأستاذ المساعد يوليان هي من المعهد المشترك لجامعة شنغهاي جياو تونغ طريقة جديدة لتحديد الكميات الفيزيائية الرئيسية التي تحدد Eads، وهي تجربة حذف الميزة القائمة على التعلم الآلي التلقائي، والتي تحقق الاستخراج التلقائي للمعرفة من قاعدة بيانات نظرية الكثافة الوظيفية عالية الإنتاجية. هذه المقالة عبارة عن تفسير مفصل ومشاركة للبحث.
شاهد التقرير الكامل:https://go.hyper.ai/LEVS1
قام فريق جوجل بتطوير نموذج للتنبؤ بالنهر يعتمد على التعلم الآلي. وتتفوق قدرة النموذج على التنبؤ على نظام GloFAS، وهو أكثر أنظمة التنبؤ بالفيضانات تقدماً في العالم. يمكنه تقديم توقعات موثوقة للفيضانات قبل 5 أيام من حدوثها وتغطية أكثر من 80 دولة. هذه المقالة عبارة عن مشاركة وتفسير للبحث.
شاهد المقال كاملا:https://go.hyper.ai/V4r4i
اقترح فريق البحث بجامعة شنغهاي جياو تونغ طريقة التعلم شبه الخاضعة للإشراف PBCT، والتي تستفيد بشكل كامل من البيانات غير المصنفة منخفضة التكلفة والوفيرة التي يتم إنشاؤها خلال دورة حياة بطاريات الليثيوم بالكامل. من خلال استخراج المعلومات المخفية، فإنه يعمق فهم أنماط البيانات الأساسية ويحسن دقة التنبؤ بعمر بطارية الليثيوم بواسطة 20%. هذه المقالة عبارة عن مشاركة وتفسير للبحث.
شاهد التقرير الكامل:https://go.hyper.ai/2EQGa
مقالات موسوعية شعبية
1. العصر
2. معدل التعلم
3. اختبار t المقترن
4. نموذج الانتشار
5. نموذج اللغة الكبير
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
معاينة البث المباشر لمحطة B
أعلنت Google مؤخرًا أنها ستعقد مؤتمر مطوري I/O لعام 2024 في 14 مايو. ولمساعدة الجميع على اكتساب فهم أعمق لـ Google،غرفة البث المباشر العصبية الفائقة سوفابتداءً من الإثنين المقبل، سنقوم ببث فيديو "جوجل الخاص" مباشرة على مدار 24 ساعة طوال أيام الأسبوع.يتضمن: المؤتمرات الصحفية الخاصة بـ Google I/O على مر السنين، والمقابلات مع المديرين التنفيذيين، والأفلام الوثائقية ذات الصلة وغيرها من المحتوى الغني.
الجدول التالي هو معاينة للمحتوى الذي حدده المحرر↓↓↓
تاريخ | وقت | محتوى |
15 أبريل الاثنين | 18:00 | مؤتمرات Google I/O على مر السنين |
الثلاثاء 16 أبريل | 18:00 | مؤتمرات Google Cloud NEXT |
الأربعاء 17 أبريل | 18:00 | مقابلة TIME100 مع سوندار بيتشاي |
الخميس 18 أبريل | 18:00 | الرئيس التنفيذي لشركة جوجل يتحدث عن سباق الذكاء الاصطناعي بين الولايات المتحدة والصين |
الجمعة 19 أبريل | 18:00 | فيلم وثائقي عن ألفا جو |
السبت 20 أبريل | 18:00 | القصة وراء مؤسس جوجل |
الأحد 21 أبريل | 18:00 | فيلم وثائقي من إنتاج بي بي سي: عالم بلا جوجل |
تبث قناة Super Neuro TV بثًا مباشرًا على مدار 24 ساعة طوال أيام الأسبوع. انقر للحصول على "المخللات الإلكترونية" في مجال الذكاء الاصطناعي:
http://live.bilibili.com/26483094
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة
* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: