HyperAI

تتنافس مايكروسوفت وتينسنت في التكنولوجيا، وتقود TRELLIS الاتجاه الجديد لدعم التنسيقات المتعددة في مجال إنشاء ثلاثي الأبعاد؛ تمت الإجابة على أكثر من 5 آلاف سؤال! يسمح VIS-Bench للذكاء الاصطناعي بتعلم "الذاكرة المكانية"

特色图像

في نوفمبر الماضي، أطلقت شركة Tencent نموذج Hunyuan3D التوليدي، وهو أول نموذج كبير مفتوح المصدر في الصناعة يدعم إنشاء النصوص والصور ثلاثية الأبعاد. وبعد أقل من شهر، أطلقت مايكروسوفت إطار عمل جديد، TRELLIS، للانضمام إلى المنافسة في مجال إنشاء الأصول ثلاثية الأبعاد. يدعم TRELLIS تنسيقات إخراج متعددة، بما في ذلك مجال الإشعاع، والغاوسي ثلاثي الأبعاد، والشبكة، مما يوفر أقصى قدر من المرونة للاحتياجات المختلفة.

كلا النموذجين متاحان الآن على موقع hyper.ai. تعال وحاول أن ترى أيهما أفضل.

استخدم Hunyuan3D عبر الإنترنت:https://go.hyper.ai/Rsrno

استخدام TRELLIS عبر الإنترنت:https://go.hyper.ai/JE5s5

من 6 يناير إلى 11 يناير، تحديثات الموقع الرسمي لـ hyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 6

* اختيار المقالات المجتمعية: 8 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات ذات المواعيد النهائية في يناير: 7

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. معيار الذكاء المكاني البصري VSI-Bench

تحتوي مجموعة البيانات على أكثر من 5 آلاف زوج من الأسئلة والأجوبة، تغطي ما يقرب من 290 مقطع فيديو لمشهد داخلي حقيقي، وتشمل مجموعة متنوعة من البيئات مثل المساكن والمكاتب والمصانع، وتغطي قضايا متعددة مثل التعرف على الأشياء، وعلاقة الموضع، والتنبؤ بالإجراء.

الاستخدام المباشر:https://go.hyper.ai/q0DYA

عرض توضيحي لمهمة VSI-Bench

2. مجموعة بيانات استخراج ملامح الوجه مجموعة بيانات استخراج ملامح الوجه

تحتوي مجموعة البيانات هذه على 750 صورة لاكتشاف مناطق الحاجبين والعينين والأنف والشفتين واللحية في الوجه. تم إجراء عملية تصنيف البيانات في Roboflow وتم تصديرها بتنسيق YOLOv8.

الاستخدام المباشر:https://go.hyper.ai/O3kER

مثال لمجموعة البيانات

3. مجموعة بيانات تحليل المشاعر والعواطف مجموعة بيانات تحليل المشاعر والعواطف

تحتوي مجموعة البيانات على 422000 جملة لتحليل المشاعر و3309 جملة لتحليل المشاعر كمكملات. تحليل المشاعر يحدد 6 مشاعر مختلفة: الفرح، الحزن، الغضب، الخوف، الحب، والمفاجأة.

الاستخدام المباشر:https://go.hyper.ai/wFNO6

4. مجموعة بيانات تدريب مسائل البرمجة الرياضية Eurus-2-RL-Data

تُعد مجموعة البيانات هذه مجموعة بيانات عالية الجودة تُستخدم خصيصًا لتدريب التعلم المعزز. يتم استخدامه بشكل أساسي لحل المشكلات الرياضية والبرمجية. يحتوي على حوالي 455 ألف مسألة رياضية و 27 ألف مسألة برمجية.

الاستخدام المباشر:https://go.hyper.ai/Wdo1k

5. مجموعة بيانات الاستدلال الطبي o1 SFT

تم تصميم مجموعة البيانات هذه لضبط نموذج اللغة الطبية الكبير HuatuoGPT-o1 لتحسين أدائه في مهام التفكير الطبي المعقدة. يعتمد بناء مجموعة البيانات على GPT-4o، الذي يضمن دقة وموثوقية البيانات من خلال البحث عن الأسئلة الطبية القابلة للتحقق والتحقق من الإجابات باستخدام أداة التحقق الطبي.

الاستخدام المباشر:https://go.hyper.ai/XMtXp

6. مجموعة بيانات النصوص الصينية المبسطة MCTS

تحتوي مجموعة البيانات على 723 جملة منظمة معقدة تم اختيارها من مجموعة أخبار بناءً على معيار Penn Chinese Treebank (CTB)، وكل جملة مجهزة بإصدارات متعددة مبسطة يدويًا، مما يجعلها أكبر مجموعة بيانات تقييمية وأكثرها مرجعية لمهمة تبسيط النص الصيني.

الاستخدام المباشر:https://go.hyper.ai/UR3CN

7. educhat-sft-002-data-osm مجموعة بيانات الحوار التعليمي

تحتوي مجموعة البيانات على 4 ملايين نقطة بيانات، تغطي مجموعة متنوعة من القطاعات التعليمية، مثل الأسئلة والأجوبة المفتوحة، وتصحيح المقالات، والتدريس الاستدلالي، والدعم العاطفي، وتدريس الدورات.

الاستخدام المباشر:https://go.hyper.ai/nQw0K

8. مجموعة بيانات ضبط المهام الحسابية GOAT

تحتوي مجموعة البيانات هذه على ملفين: dataset.json و dataset.ipynb. يحتوي ملف dataset.json على حوالي 1.7 مليون بيانات اصطناعية للمهام الحسابية التي تم إنشاؤها بواسطة dataset.ipynb.

الاستخدام المباشر:https://go.hyper.ai/8ZAvG

9. مجموعة بيانات الاستدلال الرياضي NaturalProofs

تُعد مجموعة البيانات مجموعة متعددة المجالات لدراسة التفكير الرياضي في اللغة الطبيعية. يحتوي الكتاب على ما يقرب من 30 ألف بيان ومبرهنة نظرية، و15 ألف تعريف، و2 ألف صفحة إضافية (على سبيل المثال، البديهيات، والنتائج المترتبة عليها)، وكلها مكتوبة بلغة رياضية طبيعية.

الاستخدام المباشر:https://go.hyper.ai/Bk4WE

10. مجموعة بيانات ما قبل التدريب لحوار حركة المرور TransGPT-pt&sft

تشكل مجموعة البيانات هذه جزءًا من TransGPT، أول نموذج شامل للنقل في الصين. ويحتوي على حوالي 346000 قطعة من بيانات النص في مجال النقل، والتي تستخدم للتدريب المسبق في هذا المجال، وحوالي 58000 قطعة من بيانات الحوار في مجال النقل، والتي تستخدم للضبط الدقيق.

الاستخدام المباشر:https://go.hyper.ai/vuDHa

دروس تعليمية عامة مختارة

1. Hunyuan3D: إنشاء أصول ثلاثية الأبعاد في 10 ثوانٍ فقط

Hunyuan3D هو نموذج انتشار توليدي ثلاثي الأبعاد، يتضمن إصدارًا خفيف الوزن وإصدارًا قياسيًا، وكلاهما يدعم إنشاء أصول ثلاثية الأبعاد عالية الجودة من مدخلات النصوص والصور. بعد التقييم متعدد الأبعاد النوعي والكمي، أظهر Hunyuan3D-1.0 أداءً جيدًا للغاية من حيث التفاصيل الهندسية، وتفاصيل الملمس، وتناسق الملمس والهندسة، والعقلانية ثلاثية الأبعاد، والامتثال للتعليمات.

يعد هذا البرنامج التعليمي نسخة خفيفة الوزن من Hunyuan3D. انقر على الرابط أدناه واتبع تعليمات البرنامج التعليمي لتجربة إنشاء نموذج ثلاثي الأبعاد.

تشغيل عبر الإنترنت:https://go.hyper.ai/Rsrno

أمثلة التأثير

2.  TRELLIS: عرض توضيحي لنموذج إنشاء الأصول ثلاثية الأبعاد مفتوح المصدر من Microsoft

TRELLIS هو إطار عمل للتفسير يعتمد على الشبكة العصبية الرسومية تم تطويره بواسطة فريق Microsoft في عام 2024. ويهدف إلى توفير إمكانية تفسير النموذج بكفاءة من خلال التعرف على خصائص البيانات المنظمة للرسم البياني.

لقد تم نشر النموذج والبيئة. بإمكانك استخدام النموذج الكبير لتحويل الصور إلى صور ثلاثية الأبعاد وفقًا لإرشادات البرنامج التعليمي.

تشغيل عبر الإنترنت:https://go.hyper.ai/JE5s5

أمثلة التأثير

3.النشر السريع لـ ChatGLM2-6b-32k

ChatGLM-6B هو نموذج لغة محادثة مفتوح المصدر يدعم اللغتين الصينية والإنجليزية. يعتمد على بنية النموذج اللغوي العام (GLM) ويحتوي على 6.2 مليار معلمة. باستخدام تقنية كمية النموذج، يمكن للمستخدمين تنفيذ مستوى محلي (كمية INT4) على بطاقات الرسوميات المخصصة للمستهلكين مع ما يصل إلى 6 جيجابايت من ذاكرة الفيديو.

اتبع خطوات البرنامج التعليمي وانسخ عنوان API الناتج مباشرةً لاستخدام ChatGLM-6B.

تشغيل عبر الإنترنت:https://go.hyper.ai/B0b7V

نموذج واجهة الويب

4. معالجة اللغة الطبيعية باستخدام NLTK

NLTK هي واحدة من المنصات الأكثر شعبية لإنشاء برامج Python باستخدام بيانات اللغة الطبيعية. بالإضافة إلى مكتبات معالجة النصوص للتصنيف، والتجزئة، والتقسيم، والترميز، والوسم، والتحليل، والاستدلال الدلالي، فإنه يوفر واجهات بسيطة لأكثر من 50 مجموعة بيانات نصية كبيرة منظمة (مجموعات) وموارد معجمية.

يوضح هذا البرنامج التعليمي كيفية استخدام NLTK لإجراء عمليات NLP المختلفة في مرحلة معالجة النصوص وإنشاء نموذج Keras بمساعدة بعض أدوات NLTK لتصنيف النصوص وتحليل المشاعر.

تشغيل عبر الإنترنت:https://go.hyper.ai/BFZ10

مثال على توزيع تردد الكلمات

5. برنامج تعليمي لتحرير الصوت باستخدام Audio LDM

AudioLDM هو نموذج نشر نص إلى صوت كامن قادر على إنشاء عينات صوتية واقعية مع الأخذ في الاعتبار أي إدخال نصي. يقوم AudioLDM بأخذ نص موجه كمدخل ويتوقع الصوت المقابل. يمكنه إنشاء مؤثرات صوتية مشروطة بالنص، والكلام البشري، والموسيقى.

يمكن لهذا المشروع إنشاء واجهة تفاعلية أمامية من خلال واجهة Gradio. لقد تم نشر النماذج والتبعيات ذات الصلة. انقر على الرابط أدناه لتحرير الصوت.

تشغيل عبر الإنترنت:https://go.hyper.ai/BCOWL

6. ShowUI: نموذج رؤية ولغة وعمل يركز على أتمتة واجهة المستخدم الرسومية

يدعم نموذج ShowUI سيناريوهات تطبيقات الويب والجوال من خلال فهم محتوى واجهة الشاشة وتنفيذ إجراءات تفاعلية مثل النقر والإدخال والتمرير. يمكنه إكمال مهام واجهة المستخدم المعقدة تلقائيًا. يمكن لـ ShowUI تحليل لقطات الشاشة وأوامر المستخدم للتنبؤ بالإجراءات التفاعلية على الواجهة.

يعد هذا البرنامج التعليمي عرضًا توضيحيًا لنشر النموذج بنقرة واحدة. كل ما عليك فعله هو استنساخ الحاوية وبدء تشغيلها ونسخ عنوان API الناتج مباشرة لتجربة النموذج.

تشغيل عبر الإنترنت:https://go.hyper.ai/reHs7

نموذج واجهة الويب

💡لقد قمنا أيضًا بتأسيس مجموعة تبادل تعليمية حول الانتشار المستقر. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة والتعليق على [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق ~

مقالات المجتمع

1. مجموعة من 10 مجموعات بيانات رائعة عن عيد الميلاد: الأغاني الشعبية / قوائم أمنيات الهدايا / الوصفات / 10 سنوات من كتابة المحتوى الإعلاني على تويتر حول عيد الميلاد…

خلال موسم عيد الميلاد، قامت HyperAI بإعداد 10 مجموعات بيانات متعلقة بعيد الميلاد لك، والتي تدعم الاستخدام عبر الإنترنت والتنزيل السريع. تعالوا وجربوها.

عرض ملخص مجموعة البيانات:https://go.hyper.ai/if7Lc

2. انخفضت التكاليف 100 مرة! طورت منظمة E11 Bio، وهي منظمة غير ربحية، طريقة جديدة لرسم خريطة الاتصالات بين ملايين الخلايا في الدماغ

أطلقت شركة التكنولوجيا الحيوية E11 Bio تقنية PRISM، التي يمكنها رسم خريطة للاتصالات بين ملايين الخلايا في جميع أنحاء الدماغ بتكلفة منخفضة للغاية. ومن المتوقع أن تؤدي هذه السلسلة من الابتكارات إلى خفض التكلفة الإجمالية لربط الدماغ بالكامل بما لا يقل عن 100 مرة، مما يوفر إمكانيات لاستكشاف الدماغ البشري في المستقبل. هذه المقالة عبارة عن تقرير مفصل عن الشركة، اضغط لقراءته بسرعة.

شاهد التقرير الكامل:https://go.hyper.ai/ISc4j

3. السياسات متعددة الجنسيات/الاختراقات العلمية/الرواد/تخطيط المؤسسات... كل الأحداث الرئيسية لصناعة الذكاء الاصطناعي من أجل الخدمات في عام 2024 في مقال واحد

قامت شركة HyperAI بتصنيف ومراجعة الأحداث ذات التأثير الكبير في مجال الذكاء الاصطناعي للعلوم في عام 2024. انقر هنا لعرض التقرير المفصل.

شاهد التقرير الكامل:https://go.hyper.ai/d2Dlv

4. من الصعب عكس ظاهرة الاحتباس الحراري. يستخدم فريق ستانفورد الذكاء الاصطناعي للتنبؤ بأعلى التغيرات في درجات الحرارة، مع احتمالية قياسية تبلغ 90%

على خلفية استمرار ظاهرة الاحتباس الحراري العالمي، بدأت الأحداث المناخية المتطرفة النادرة تقع بشكل متكرر. استخدم فريق بحثي من جامعة ستانفورد وجامعة ولاية كولورادو والمعهد الفيدرالي السويسري للتكنولوجيا في زيورخ نظام الشبكة العصبية التلافيفية للذكاء الاصطناعي للتنبؤ بالاحتباس الحراري ووجد أنه حتى لو تمكنا من تحقيق تخفيضات سريعة في الانبعاثات، لا يزال هناك احتمال 90% أن تستمر درجات الحرارة العالمية في الارتفاع. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد التقرير الكامل:https://go.hyper.ai/vDt3e

5. نجح فريق جامعة بيردو في تحقيق تمثيل لمسي فعال للبيانات لتعلم الروبوتات من خلال محاكاة الإمساك التفاعلي البشري

شارك Xu Zhengtong، وهو طالب دكتوراه في السنة الثالثة بجامعة بيردو، بنتائج بحثه العلمي الرئيسيتين، وهما وحدة التحكم التفاعلية LeTac-MPC وUniT للتمثيل اللمسي الموحد للروبوتات، تحت عنوان "التمثيل اللمسي الفعال للبيانات من أجل تعلم الروبوت". هذه المقالة عبارة عن تجميع للمحتوى المشترك، انقر هنا لقراءتها بسرعة.

شاهد التقرير الكامل:https://go.hyper.ai/IPIjj

6. خمس معارك من أجل CASP، وهو معيار للتنبؤ ببنية البروتين، تشنغ وي من جامعة نانكاي: زيادة القدرة التنافسية والصعوبة، والتركيز على المشكلات البيولوجية العملية

لقد اعتبرت الصناعة منذ فترة طويلة CASP بمثابة مقياس للتنبؤ ببنية البروتين. وفي هذا السياق، كان لشركة HyperAI شرف إجراء مقابلة معمقة مع البروفيسور تشنغ وي. ومن خلال CASP، وهي مسابقة دولية تعمل كمعيار للصناعة، قام بتحليل اتجاهات التطوير الحالية في مجال التنبؤ ببنية البروتين. مليئة بالمعلومات المفيدة، اضغط لقراءتها بسرعة.

شاهد التقرير الكامل:https://go.hyper.ai/Y83iz

7. بعد 30 عامًا من المثابرة، يهدف معهد ماساتشوستس للتكنولوجيا إلى الجيل القادم من بطاريات الليثيوم ويستخدم الذكاء الاصطناعي التوليدي لتحقيق تقدم كبير في مجال الإلكتروليتات الصلبة

في دراسة حديثة، قام فريق بحثي من معهد ماساتشوستس للتكنولوجيا ومعهد تويوتا للأبحاث بالبحث في تعقيدات النماذج التوليدية المتقدمة المختلفة في توليد البوليمر واقترحوا طريقة تصميم جديدة يمكنها توليد وتقييم إلكتروليتات بوليمرية جديدة تعتمد على GPT والانتشار بشكل مستمر، مما يوفر مرشحين جدد للاختبار التجريبي. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد التقرير الكامل:https://go.hyper.ai/PDc8J

8. فقط! تم تسعير أسرع وحدة معالجة رسومية في العالم RTX 5090 رسميًا بأكثر من 14000 يوان، وتم تسعير النسخة الصينية من 5090 D المخصية بأكثر من 16000 يوان

تم الإعلان رسميًا عن بطاقة Nvidia RTX 5090 في مؤتمر CES 2025. إنها أسرع وحدة معالجة رسومية GeForce RTX حتى الآن. السعر الأولي هو 14 ألف يوان، وسعر النسخة المحلية من 5090 D هو 16 ألف يوان. وتضيف RTX 5090 أيضًا دعم FP4، مما يسمح بمساحة ذاكرة أصغر وتشغيل نماذج الذكاء الاصطناعي التوليدية بشكل أسرع بما يصل إلى 2x من الجيل السابق. تعتبر هذه المقالة مقدمة تفصيلية للمنتج، انقر هنا لقراءتها بسرعة.

شاهد التقرير الكامل:https://go.hyper.ai/dyyZS

مقالات موسوعية شعبية

1. القاعدة النووية

2. اختبار t المقترن

3. فهم اللغة متعدد المهام على نطاق واسع (MMLU)

4. وظيفة السيني

5. طريقة المربعات الصغرى

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

الموعد النهائي لشهر يناير للمؤتمر الأعلى

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1700 مجموعة بيانات عامة

* يتضمن أكثر من 500 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 200 حالة بحثية من AI4Science

* يدعم البحث عن أكثر من 600 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai

وأخيرًا، أوصي ببرنامج "حوافز المبدعين". يمكن للأصدقاء المهتمين مسح رمز الاستجابة السريعة للمشاركة!