تتنافس مايكروسوفت وتينسنت في التكنولوجيا، وتقود TRELLIS الاتجاه الجديد لدعم التنسيقات المتعددة في مجال إنشاء ثلاثي الأبعاد؛ تمت الإجابة على أكثر من 5 آلاف سؤال! يسمح VIS-Bench للذكاء الاصطناعي بتعلم "الذاكرة المكانية"

في نوفمبر الماضي، أطلقت شركة Tencent نموذج Hunyuan3D التوليدي، وهو أول نموذج كبير مفتوح المصدر في الصناعة يدعم إنشاء النصوص والصور ثلاثية الأبعاد. وبعد أقل من شهر، أطلقت مايكروسوفت إطار عمل جديد، TRELLIS، للانضمام إلى المنافسة في مجال إنشاء الأصول ثلاثية الأبعاد. يدعم TRELLIS تنسيقات إخراج متعددة، بما في ذلك مجال الإشعاع، والغاوسي ثلاثي الأبعاد، والشبكة، مما يوفر أقصى قدر من المرونة للاحتياجات المختلفة.
كلا النموذجين متاحان الآن على موقع hyper.ai. تعال وحاول أن ترى أيهما أفضل.
استخدم Hunyuan3D عبر الإنترنت:https://go.hyper.ai/Rsrno
استخدام TRELLIS عبر الإنترنت:https://go.hyper.ai/JE5s5
من 6 يناير إلى 11 يناير، تحديثات الموقع الرسمي لـ hyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 6
* اختيار المقالات المجتمعية: 8 مقالات
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات ذات المواعيد النهائية في يناير: 7
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. معيار الذكاء المكاني البصري VSI-Bench
تحتوي مجموعة البيانات على أكثر من 5 آلاف زوج من الأسئلة والأجوبة، تغطي ما يقرب من 290 مقطع فيديو لمشهد داخلي حقيقي، وتشمل مجموعة متنوعة من البيئات مثل المساكن والمكاتب والمصانع، وتغطي قضايا متعددة مثل التعرف على الأشياء، وعلاقة الموضع، والتنبؤ بالإجراء.
الاستخدام المباشر:https://go.hyper.ai/q0DYA

2. مجموعة بيانات استخراج ملامح الوجه مجموعة بيانات استخراج ملامح الوجه
تحتوي مجموعة البيانات هذه على 750 صورة لاكتشاف مناطق الحاجبين والعينين والأنف والشفتين واللحية في الوجه. تم إجراء عملية تصنيف البيانات في Roboflow وتم تصديرها بتنسيق YOLOv8.
الاستخدام المباشر:https://go.hyper.ai/O3kER

3. مجموعة بيانات تحليل المشاعر والعواطف مجموعة بيانات تحليل المشاعر والعواطف
تحتوي مجموعة البيانات على 422000 جملة لتحليل المشاعر و3309 جملة لتحليل المشاعر كمكملات. تحليل المشاعر يحدد 6 مشاعر مختلفة: الفرح، الحزن، الغضب، الخوف، الحب، والمفاجأة.
الاستخدام المباشر:https://go.hyper.ai/wFNO6
4. مجموعة بيانات تدريب مسائل البرمجة الرياضية Eurus-2-RL-Data
تُعد مجموعة البيانات هذه مجموعة بيانات عالية الجودة تُستخدم خصيصًا لتدريب التعلم المعزز. يتم استخدامه بشكل أساسي لحل المشكلات الرياضية والبرمجية. يحتوي على حوالي 455 ألف مسألة رياضية و 27 ألف مسألة برمجية.
الاستخدام المباشر:https://go.hyper.ai/Wdo1k
5. مجموعة بيانات الاستدلال الطبي o1 SFT
تم تصميم مجموعة البيانات هذه لضبط نموذج اللغة الطبية الكبير HuatuoGPT-o1 لتحسين أدائه في مهام التفكير الطبي المعقدة. يعتمد بناء مجموعة البيانات على GPT-4o، الذي يضمن دقة وموثوقية البيانات من خلال البحث عن الأسئلة الطبية القابلة للتحقق والتحقق من الإجابات باستخدام أداة التحقق الطبي.
الاستخدام المباشر:https://go.hyper.ai/XMtXp
6. مجموعة بيانات النصوص الصينية المبسطة MCTS
تحتوي مجموعة البيانات على 723 جملة منظمة معقدة تم اختيارها من مجموعة أخبار بناءً على معيار Penn Chinese Treebank (CTB)، وكل جملة مجهزة بإصدارات متعددة مبسطة يدويًا، مما يجعلها أكبر مجموعة بيانات تقييمية وأكثرها مرجعية لمهمة تبسيط النص الصيني.
الاستخدام المباشر:https://go.hyper.ai/UR3CN
7. educhat-sft-002-data-osm مجموعة بيانات الحوار التعليمي
تحتوي مجموعة البيانات على 4 ملايين نقطة بيانات، تغطي مجموعة متنوعة من القطاعات التعليمية، مثل الأسئلة والأجوبة المفتوحة، وتصحيح المقالات، والتدريس الاستدلالي، والدعم العاطفي، وتدريس الدورات.
الاستخدام المباشر:https://go.hyper.ai/nQw0K
8. مجموعة بيانات ضبط المهام الحسابية GOAT
تحتوي مجموعة البيانات هذه على ملفين: dataset.json و dataset.ipynb. يحتوي ملف dataset.json على حوالي 1.7 مليون بيانات اصطناعية للمهام الحسابية التي تم إنشاؤها بواسطة dataset.ipynb.
الاستخدام المباشر:https://go.hyper.ai/8ZAvG
9. مجموعة بيانات الاستدلال الرياضي NaturalProofs
تُعد مجموعة البيانات مجموعة متعددة المجالات لدراسة التفكير الرياضي في اللغة الطبيعية. يحتوي الكتاب على ما يقرب من 30 ألف بيان ومبرهنة نظرية، و15 ألف تعريف، و2 ألف صفحة إضافية (على سبيل المثال، البديهيات، والنتائج المترتبة عليها)، وكلها مكتوبة بلغة رياضية طبيعية.
الاستخدام المباشر:https://go.hyper.ai/Bk4WE
10. مجموعة بيانات ما قبل التدريب لحوار حركة المرور TransGPT-pt&sft
تشكل مجموعة البيانات هذه جزءًا من TransGPT، أول نموذج شامل للنقل في الصين. ويحتوي على حوالي 346000 قطعة من بيانات النص في مجال النقل، والتي تستخدم للتدريب المسبق في هذا المجال، وحوالي 58000 قطعة من بيانات الحوار في مجال النقل، والتي تستخدم للضبط الدقيق.
الاستخدام المباشر:https://go.hyper.ai/vuDHa
دروس تعليمية عامة مختارة
1. Hunyuan3D: إنشاء أصول ثلاثية الأبعاد في 10 ثوانٍ فقط
Hunyuan3D هو نموذج انتشار توليدي ثلاثي الأبعاد، يتضمن إصدارًا خفيف الوزن وإصدارًا قياسيًا، وكلاهما يدعم إنشاء أصول ثلاثية الأبعاد عالية الجودة من مدخلات النصوص والصور. بعد التقييم متعدد الأبعاد النوعي والكمي، أظهر Hunyuan3D-1.0 أداءً جيدًا للغاية من حيث التفاصيل الهندسية، وتفاصيل الملمس، وتناسق الملمس والهندسة، والعقلانية ثلاثية الأبعاد، والامتثال للتعليمات.
يعد هذا البرنامج التعليمي نسخة خفيفة الوزن من Hunyuan3D. انقر على الرابط أدناه واتبع تعليمات البرنامج التعليمي لتجربة إنشاء نموذج ثلاثي الأبعاد.
تشغيل عبر الإنترنت:https://go.hyper.ai/Rsrno

2. TRELLIS: عرض توضيحي لنموذج إنشاء الأصول ثلاثية الأبعاد مفتوح المصدر من Microsoft
TRELLIS هو إطار عمل للتفسير يعتمد على الشبكة العصبية الرسومية تم تطويره بواسطة فريق Microsoft في عام 2024. ويهدف إلى توفير إمكانية تفسير النموذج بكفاءة من خلال التعرف على خصائص البيانات المنظمة للرسم البياني.
لقد تم نشر النموذج والبيئة. بإمكانك استخدام النموذج الكبير لتحويل الصور إلى صور ثلاثية الأبعاد وفقًا لإرشادات البرنامج التعليمي.
تشغيل عبر الإنترنت:https://go.hyper.ai/JE5s5

3.النشر السريع لـ ChatGLM2-6b-32k
ChatGLM-6B هو نموذج لغة محادثة مفتوح المصدر يدعم اللغتين الصينية والإنجليزية. يعتمد على بنية النموذج اللغوي العام (GLM) ويحتوي على 6.2 مليار معلمة. باستخدام تقنية كمية النموذج، يمكن للمستخدمين تنفيذ مستوى محلي (كمية INT4) على بطاقات الرسوميات المخصصة للمستهلكين مع ما يصل إلى 6 جيجابايت من ذاكرة الفيديو.
اتبع خطوات البرنامج التعليمي وانسخ عنوان API الناتج مباشرةً لاستخدام ChatGLM-6B.
تشغيل عبر الإنترنت:https://go.hyper.ai/B0b7V

4. معالجة اللغة الطبيعية باستخدام NLTK
NLTK هي واحدة من المنصات الأكثر شعبية لإنشاء برامج Python باستخدام بيانات اللغة الطبيعية. بالإضافة إلى مكتبات معالجة النصوص للتصنيف، والتجزئة، والتقسيم، والترميز، والوسم، والتحليل، والاستدلال الدلالي، فإنه يوفر واجهات بسيطة لأكثر من 50 مجموعة بيانات نصية كبيرة منظمة (مجموعات) وموارد معجمية.
يوضح هذا البرنامج التعليمي كيفية استخدام NLTK لإجراء عمليات NLP المختلفة في مرحلة معالجة النصوص وإنشاء نموذج Keras بمساعدة بعض أدوات NLTK لتصنيف النصوص وتحليل المشاعر.
تشغيل عبر الإنترنت:https://go.hyper.ai/BFZ10

5. برنامج تعليمي لتحرير الصوت باستخدام Audio LDM
AudioLDM هو نموذج نشر نص إلى صوت كامن قادر على إنشاء عينات صوتية واقعية مع الأخذ في الاعتبار أي إدخال نصي. يقوم AudioLDM بأخذ نص موجه كمدخل ويتوقع الصوت المقابل. يمكنه إنشاء مؤثرات صوتية مشروطة بالنص، والكلام البشري، والموسيقى.
يمكن لهذا المشروع إنشاء واجهة تفاعلية أمامية من خلال واجهة Gradio. لقد تم نشر النماذج والتبعيات ذات الصلة. انقر على الرابط أدناه لتحرير الصوت.
تشغيل عبر الإنترنت:https://go.hyper.ai/BCOWL
6. ShowUI: نموذج رؤية ولغة وعمل يركز على أتمتة واجهة المستخدم الرسومية
يدعم نموذج ShowUI سيناريوهات تطبيقات الويب والجوال من خلال فهم محتوى واجهة الشاشة وتنفيذ إجراءات تفاعلية مثل النقر والإدخال والتمرير. يمكنه إكمال مهام واجهة المستخدم المعقدة تلقائيًا. يمكن لـ ShowUI تحليل لقطات الشاشة وأوامر المستخدم للتنبؤ بالإجراءات التفاعلية على الواجهة.
يعد هذا البرنامج التعليمي عرضًا توضيحيًا لنشر النموذج بنقرة واحدة. كل ما عليك فعله هو استنساخ الحاوية وبدء تشغيلها ونسخ عنوان API الناتج مباشرة لتجربة النموذج.
تشغيل عبر الإنترنت:https://go.hyper.ai/reHs7

💡لقد قمنا أيضًا بتأسيس مجموعة تبادل تعليمية حول الانتشار المستقر. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة والتعليق على [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق ~

مقالات المجتمع
خلال موسم عيد الميلاد، قامت HyperAI بإعداد 10 مجموعات بيانات متعلقة بعيد الميلاد لك، والتي تدعم الاستخدام عبر الإنترنت والتنزيل السريع. تعالوا وجربوها.
عرض ملخص مجموعة البيانات:https://go.hyper.ai/if7Lc
أطلقت شركة التكنولوجيا الحيوية E11 Bio تقنية PRISM، التي يمكنها رسم خريطة للاتصالات بين ملايين الخلايا في جميع أنحاء الدماغ بتكلفة منخفضة للغاية. ومن المتوقع أن تؤدي هذه السلسلة من الابتكارات إلى خفض التكلفة الإجمالية لربط الدماغ بالكامل بما لا يقل عن 100 مرة، مما يوفر إمكانيات لاستكشاف الدماغ البشري في المستقبل. هذه المقالة عبارة عن تقرير مفصل عن الشركة، اضغط لقراءته بسرعة.
شاهد التقرير الكامل:https://go.hyper.ai/ISc4j
قامت شركة HyperAI بتصنيف ومراجعة الأحداث ذات التأثير الكبير في مجال الذكاء الاصطناعي للعلوم في عام 2024. انقر هنا لعرض التقرير المفصل.
شاهد التقرير الكامل:https://go.hyper.ai/d2Dlv
على خلفية استمرار ظاهرة الاحتباس الحراري العالمي، بدأت الأحداث المناخية المتطرفة النادرة تقع بشكل متكرر. استخدم فريق بحثي من جامعة ستانفورد وجامعة ولاية كولورادو والمعهد الفيدرالي السويسري للتكنولوجيا في زيورخ نظام الشبكة العصبية التلافيفية للذكاء الاصطناعي للتنبؤ بالاحتباس الحراري ووجد أنه حتى لو تمكنا من تحقيق تخفيضات سريعة في الانبعاثات، لا يزال هناك احتمال 90% أن تستمر درجات الحرارة العالمية في الارتفاع. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.
شاهد التقرير الكامل:https://go.hyper.ai/vDt3e
شارك Xu Zhengtong، وهو طالب دكتوراه في السنة الثالثة بجامعة بيردو، بنتائج بحثه العلمي الرئيسيتين، وهما وحدة التحكم التفاعلية LeTac-MPC وUniT للتمثيل اللمسي الموحد للروبوتات، تحت عنوان "التمثيل اللمسي الفعال للبيانات من أجل تعلم الروبوت". هذه المقالة عبارة عن تجميع للمحتوى المشترك، انقر هنا لقراءتها بسرعة.
شاهد التقرير الكامل:https://go.hyper.ai/IPIjj
لقد اعتبرت الصناعة منذ فترة طويلة CASP بمثابة مقياس للتنبؤ ببنية البروتين. وفي هذا السياق، كان لشركة HyperAI شرف إجراء مقابلة معمقة مع البروفيسور تشنغ وي. ومن خلال CASP، وهي مسابقة دولية تعمل كمعيار للصناعة، قام بتحليل اتجاهات التطوير الحالية في مجال التنبؤ ببنية البروتين. مليئة بالمعلومات المفيدة، اضغط لقراءتها بسرعة.
شاهد التقرير الكامل:https://go.hyper.ai/Y83iz
في دراسة حديثة، قام فريق بحثي من معهد ماساتشوستس للتكنولوجيا ومعهد تويوتا للأبحاث بالبحث في تعقيدات النماذج التوليدية المتقدمة المختلفة في توليد البوليمر واقترحوا طريقة تصميم جديدة يمكنها توليد وتقييم إلكتروليتات بوليمرية جديدة تعتمد على GPT والانتشار بشكل مستمر، مما يوفر مرشحين جدد للاختبار التجريبي. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.
شاهد التقرير الكامل:https://go.hyper.ai/PDc8J
تم الإعلان رسميًا عن بطاقة Nvidia RTX 5090 في مؤتمر CES 2025. إنها أسرع وحدة معالجة رسومية GeForce RTX حتى الآن. السعر الأولي هو 14 ألف يوان، وسعر النسخة المحلية من 5090 D هو 16 ألف يوان. وتضيف RTX 5090 أيضًا دعم FP4، مما يسمح بمساحة ذاكرة أصغر وتشغيل نماذج الذكاء الاصطناعي التوليدية بشكل أسرع بما يصل إلى 2x من الجيل السابق. تعتبر هذه المقالة مقدمة تفصيلية للمنتج، انقر هنا لقراءتها بسرعة.
شاهد التقرير الكامل:https://go.hyper.ai/dyyZS
مقالات موسوعية شعبية
1. القاعدة النووية
2. اختبار t المقترن
3. فهم اللغة متعدد المهام على نطاق واسع (MMLU)
4. وظيفة السيني
5. طريقة المربعات الصغرى
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
الموعد النهائي لشهر يناير للمؤتمر الأعلى

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1700 مجموعة بيانات عامة
* يتضمن أكثر من 500 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 200 حالة بحثية من AI4Science
* يدعم البحث عن أكثر من 600 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:
وأخيرًا، أوصي ببرنامج "حوافز المبدعين". يمكن للأصدقاء المهتمين مسح رمز الاستجابة السريعة للمشاركة!
