HyperAI

عند تشغيل نموذج 70B مفتوح المصدر الوحيد في Llama 3.3 عبر الإنترنت، يكون الأداء مماثلاً لـ 405B! مجموعة بيانات OCR الخاصة بـ LaTeX متاحة الآن للمساعدة في التعرف على الصيغ الرياضية

特色图像

في هذا الشهر فقط، أصدرت Meta النموذج الوحيد مفتوح المصدر لـ Llama 3.3، وهو Llama-3.3-70B-Instruct. على الرغم من أن حجم المعلمة هو 70B فقط، إلا أن أداءه قابل للمقارنة بأداء طراز 405B. هذا هو النموذج الأخير في سلسلة Llama 3. وقال زوكربيرج وداعا سيكون لاما 4!

أطلق الموقع الرسمي لـ hyper.ai "نشر Llama-3.3-70B-Instruct بنقرة واحدة" في قسم البرنامج التعليمي. دعونا نستمتع بالعمل النهائي لـ Llama 3 معًا~

الاستخدام عبر الإنترنت:https://go.hyper.ai/TthEw

من 23 ديسمبر إلى 29 ديسمبر، تم تحديث الموقع الرسمي لـ hyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3

* اختيار المقالات المجتمعية: 6 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات التي لها مواعيد نهائية في يناير: 9

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات وصف صورة CompreCap

تحتوي مجموعة البيانات على 560 صورة، تم تقسيم كل منها دلاليًا بشكل دقيق وشرحها باستخدام الكائنات والسمات والعلاقات لتشكيل بنية رسم بياني للمشهد الموجه بالكامل.

الاستخدام المباشر:https://go.hyper.ai/icfaH

مثال لمجموعة البيانات

2. مجموعة بيانات التعرف على الخوذة HelmetViolations

تحتوي مجموعة البيانات على إجمالي 1004 صورة، موضحة بتنسيق YOLOv9، وتحتوي على 3 فئات: لوحة ترخيص (Plate)، مع خوذة (WithHelmet)، وبدون خوذة (WithoutHelmet). تحتوي مجموعة التدريب على 363 صورة (أصلية + مُعززة)؛ مجموعة التحقق تحتوي على 53 صورة؛ يتم تضمين مجموعة الاختبار في التصدير لتقييم النموذج.

الاستخدام المباشر:https://go.hyper.ai/N0Yyg

مثال لمجموعة البيانات

3. مجموعة بيانات الفيديو SynCamVideo - مجموعة بيانات الفيديو المتزامن متعدد الكاميرات

تحتوي مجموعة البيانات على 1000 مشهد مختلف، تم التقاط كل منها بواسطة 36 كاميرا، مما أدى إلى إنشاء ما مجموعه 36 ألف مقطع فيديو، مع 50 حيوانًا مختلفًا كـ "مواضيع رئيسية" واستخدام 20 موقعًا مختلفًا من بولي هافن كخلفيات.

الاستخدام المباشر:https://go.hyper.ai/oIJns

مثال لمجموعة البيانات

4. مجموعة بيانات تصنيف صور الطائرات

تحتوي هذه المجموعة من البيانات على 3,371 صورة طائرة، مقسمة إلى 10 مجلدات فئات، كل فئة تتوافق مع طراز طائرة محدد: A10، A400M، AG600، AH64، AV8B، An124، An22، An225، An72 وB1، إلخ.

الاستخدام المباشر:https://go.hyper.ai/IL3uP

مثال لمجموعة البيانات

5. مجموعة بيانات صور القصص المصورة MangaZero

مجموعة بيانات MangaZero عبارة عن مجموعة بيانات صور هزلية كبيرة الحجم ومتعددة الشخصيات ومتعددة الحالات مصممة خصيصًا لمهام إنشاء القصص المصورة. يحتوي الكتاب على 43,264 صفحة من القصص المصورة و 427,147 لوحة توضيحية. إنه يدعم تصور تفاعلات الشخصيات المختلفة وأفعالها في إطارات متتالية وهو مناسب لمهام إنشاء القصص المصورة متعددة الشخصيات ومتعددة الحالات.

الاستخدام المباشر:https://go.hyper.ai/IpkjL

6. مجموعة بيانات التعرف الضوئي على الحروف (OCR) على الصيغ الرياضية في LaTeX

مجموعة بيانات LaTeX OCR هي مجموعة بيانات تركز على مشكلة التعرف على الصيغ الرياضية المعقدة في مجال التعرف الضوئي على الحروف (OCR). تحتوي مجموعة بيانات LaTeX OCR على تكوينات متعددة، كل منها يتميز بميزات وتقسيم بيانات مختلفين.

الاستخدام المباشر:https://go.hyper.ai/lyK1J

7. مجموعة بيانات الموقع مفتوحة المصدر لنظام التشغيل FSQ

تحتوي مجموعة البيانات هذه على أكثر من 100 مليون نقطة اهتمام عالمية (POIs)، تغطي أكثر من 200 دولة ومنطقة، مما يجعل البيانات الجغرافية المكانية الغنية متاحة للباحثين والمطورين والشركات. ويوفر 22 سمة أساسية، بما في ذلك معلومات رئيسية مثل اسم المكان والعنوان وخط الطول وخط العرض، والتي تدعم تطبيقات مختلفة مثل التحليل الجغرافي المكاني وخدمات تحديد المواقع.

الاستخدام المباشر:https://go.hyper.ai/7oN5M

8. مجموعة بيانات معايير التفكير الرياضي ProcessBench

تحتوي مجموعة البيانات هذه على 3.4 ألف مثال اختبار، تركز على مسائل الرياضيات المتعلقة بالمنافسة وصعوبة الأولمبياد. يأتي كل مثال مع حل خطوة بخطوة وعلامات خطأ دقيقة من قبل خبراء المجال.

الاستخدام المباشر:https://go.hyper.ai/fk3hq

9. الحوار الطبي الصيني

تُعد مجموعة البيانات الطبية الصينية هذه موردًا شاملاً لتطوير وتدريب نماذج اللغة القادرة على تقديم محادثات وتوصيات مهنية في المجال الطبي. ويجمع هذا النموذج بين أنواع متعددة من البيانات، بما في ذلك المعرفة الموسوعية، ونصوص الكتب المدرسية، والمحادثات الفعلية بين الطبيب والمريض، وبيانات التقييم، لتحسين دقة النموذج وعمليته.

الاستخدام المباشر:https://go.hyper.ai/wkAXX

10. مجموعة بيانات تعليمية لتصحيح التباين وتصحيح عدم المحاذاة في splsoNet

spIsoNet هو برنامج تعليمي عميق ذاتي الإشراف من البداية إلى النهاية لمعالجة مشاكل تباين الخرائط وعدم محاذاة الجسيمات الناجمة عن مشكلة التوجيه المفضل. يتم استخدام هذه المجموعة من البيانات في الأبحاث، وتم نشر النتائج ذات الصلة في المجلة الأكاديمية الدولية Nature Methods.

الاستخدام المباشر:https://go.hyper.ai/tFOqJ

دروس تعليمية عامة مختارة

1. نشر Llama-3.3-70B-Instruct بنقرة واحدة

Llama-3.3-70B-Instruct هو نموذج لغوي كبير أطلقته Meta في عام 2024. وهو النموذج الوحيد مفتوح المصدر في سلسلة Llama 3.3، ويحتوي على إصدار مخصص لضبط التعليمات بدقة.

قام النموذج بتكوين البيئة والتبعيات. بإمكانك بدء محادثة مع النموذج عن طريق إدخال عنوان API.

تشغيل عبر الإنترنت:https://go.hyper.ai/TthEw

أمثلة نموذجية

2. HunyuanVideo Tencent Hunyuan Wensheng فيديو تجريبي

يهدف HunyuanVideo إلى مساعدة المستخدمين في إنشاء محتوى فيديو عالي الجودة من خلال تقنية الذكاء الاصطناعي. HunyuanVideo هو نموذج فيديو Wensheng الذي يحتوي على أكبر عدد من المعلمات بين نماذج المصدر المفتوح الحالية، مع 13 مليار معلمة. يمكنه إنشاء محتوى فيديو بدقة فيزيائية عالية وتناسق المشهد، وتزويد المستخدمين بتجربة بصرية فائقة الواقعية، ويمكنه التبديل بحرية بين الأنماط الحقيقية والافتراضية.

يوفر المشروع واجهة ويب مريحة، ويمكن للمستخدمين إنشاء مقاطع فيديو بأنماط مختلفة بمجرد تقديم وصف نصي بسيط أو تحديد الشروط.

تشغيل عبر الإنترنت:https://go.hyper.ai/hEkOw

أمثلة نموذجية

3. برنامج تريتون التعليمي: ضرب المصفوفات

في هذا البرنامج التعليمي، سوف تكتب نواة مضاعفة مصفوفة FP16 قصيرة للغاية وعالية الأداء تعمل بشكل مماثل لـ cuBLAS أو rocBLAS. على وجه التحديد، سوف تتعلم عن: ضرب المصفوفات متعددة المستويات؛ حساب المؤشر متعدد الأبعاد؛ إعادة ترتيب البرامج لتحسين معدلات الوصول إلى ذاكرة التخزين المؤقت L2؛ وضبط الأداء تلقائيًا.

تشغيل عبر الإنترنت:https://go.hyper.ai/riM7b

مثال على ضرب المصفوفات

مقالات المجتمع

1. الذكاء الاصطناعي يُقوّض كيمياء المواد، مُلخّصًا أبرز نتائج الأبحاث العلمية في عام 2024

قامت HyperAI باختيار وتصنيف 26 ورقة بحثية متطورة تم تفسيرها خلال عامي 2023-2024. تسلط هذه المقالة الضوء على أبحاث الذكاء الاصطناعي في مجال كيمياء المواد. إنها مراجعة شاملة، لذا انقر هنا لقراءتها بسرعة.

شاهد التقرير الكامل:https://go.hyper.ai/XnzcN

2. هدفنا هو بناء آلة تورينج في الكيمياء! شركة Chemify للأدوية القائمة على الذكاء الاصطناعي تطور أول مُجمِّع كيميائي في العالم وتدخل السوق الأمريكية

باعتبارها شركة كيميائية بريطانية عالية التقنية، قامت شركة Chemify بتطوير أول "آلة تورينج الكيميائية" في العالم وأول مُجمِّع كيميائي في العالم. وهي ملتزمة بدمج الحوسبة الكيميائية والذكاء الاصطناعي والروبوتات والأتمتة وما إلى ذلك في البحث والتطوير الدوائي لتعزيز التنمية الرقمية للكيمياء. هذه المقالة عبارة عن تقرير مفصل عن الشركة، اضغط لقراءته بسرعة.

شاهد التقرير الكامل:https://go.hyper.ai/V5VWB

3. يهدف إلى تحليل الصور المرضية على نطاق واسع للغاية! تقترح جامعة هواتشونغ للعلوم والتكنولوجيا نموذجًا لتجزئة الصور الطبية لتحسين دقة تشخيص متلازمة سجوجرن

اقترح البروفيسور تو وي والبروفيسور لو فنغ وآخرون من جامعة هواتشونغ للعلوم والتكنولوجيا نموذجًا لتجزئة الصور الطبية يمكنه تحديد بؤر تجمع الخلايا الليمفاوية بدقة في الصور المرضية للمرضى المصابين بمتلازمة سجوجرن، مما يساعد الأطباء على إجراء تشخيصات أسرع وأكثر دقة. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد التقرير الكامل:https://go.hyper.ai/EetpB

4. الثورة اللمسية للذكاء المتجسد في المستقبل! توفر مستشعرات TactEdge للروبوتات إدراكًا دقيقًا للمس، مما يتيح اكتشاف عيوب النسيج والتحكم في التشغيل الماهر

يجري فريق تشانغ شي شين في جامعة الصين للعلوم الجيولوجية (بكين) أبحاثًا حول أجهزة الاستشعار البصرية واللمسية منذ عام 2014. وقد استكشفوا وطوروا أجيالًا متعددة من تكنولوجيا الاستشعار وأطلقوا عليها اسم تكنولوجيا اللمس المتطورة، TactEdge. تعتبر هذه المقالة مقدمة تفصيلية لنتائج البحث ذات الصلة. انقر هنا لقراءته بسرعة.

شاهد التقرير الكامل:https://go.hyper.ai/nOE2a

5. مراجعة لتطورات الذكاء الاصطناعي في المجال الطبي في عام 2024، 35 بحثًا رائدًا لا يُمكنك تفويتها

تسلط هذه المقالة الضوء على أبحاث الذكاء الاصطناعي في مجال الرعاية الصحية. لقد قمنا باختيار 35 ورقة بحثية متطورة تم تفسيرها خلال الفترة 2023-2024 لتشاركها معكم بضائع فائقة الجودة. انقر للقراءة بسرعة.

شاهد التقرير الكامل:https://go.hyper.ai/CZdYT

6. قدم LeCun، جامعة كاليفورنيا في بيركلي وآخرون. اقترح طريقة توليد البروتين متعدد الوسائط PLAID، والتي تولد تسلسلات وهياكل بروتينية كاملة الذرات في نفس الوقت

اقترحت جامعة كاليفورنيا في بيركلي، ومايكروسوفت للأبحاث، وآخرون، طريقة توليد البروتين متعددة الوسائط PLAID، والتي يمكنها تحقيق توليد متعدد الوسائط عن طريق توليد وسائط أكثر ندرة من وسائط بيانات أكثر ثراءً. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.

شاهد التقرير الكامل:https://go.hyper.ai/nwnDy

مقالات موسوعية شعبية

1. وظيفة السيني

2. دمج الفرز المتبادل RRF

3. القاعدة النووية

4. نموذج اللغة الكبير

5. الذاكرة طويلة المدى

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event


إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!