عند تشغيل نموذج 70B مفتوح المصدر الوحيد في Llama 3.3 عبر الإنترنت، يكون الأداء مماثلاً لـ 405B! مجموعة بيانات OCR الخاصة بـ LaTeX متاحة الآن للمساعدة في التعرف على الصيغ الرياضية

في هذا الشهر فقط، أصدرت Meta النموذج الوحيد مفتوح المصدر لـ Llama 3.3، وهو Llama-3.3-70B-Instruct. على الرغم من أن حجم المعلمة هو 70B فقط، إلا أن أداءه قابل للمقارنة بأداء طراز 405B. هذا هو النموذج الأخير في سلسلة Llama 3. وقال زوكربيرج وداعا سيكون لاما 4!
أطلق الموقع الرسمي لـ hyper.ai "نشر Llama-3.3-70B-Instruct بنقرة واحدة" في قسم البرنامج التعليمي. دعونا نستمتع بالعمل النهائي لـ Llama 3 معًا~
الاستخدام عبر الإنترنت:https://go.hyper.ai/TthEw
من 23 ديسمبر إلى 29 ديسمبر، تم تحديث الموقع الرسمي لـ hyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3
* اختيار المقالات المجتمعية: 6 مقالات
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات التي لها مواعيد نهائية في يناير: 9
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات وصف صورة CompreCap
تحتوي مجموعة البيانات على 560 صورة، تم تقسيم كل منها دلاليًا بشكل دقيق وشرحها باستخدام الكائنات والسمات والعلاقات لتشكيل بنية رسم بياني للمشهد الموجه بالكامل.
الاستخدام المباشر:https://go.hyper.ai/icfaH

2. مجموعة بيانات التعرف على الخوذة HelmetViolations
تحتوي مجموعة البيانات على إجمالي 1004 صورة، موضحة بتنسيق YOLOv9، وتحتوي على 3 فئات: لوحة ترخيص (Plate)، مع خوذة (WithHelmet)، وبدون خوذة (WithoutHelmet). تحتوي مجموعة التدريب على 363 صورة (أصلية + مُعززة)؛ مجموعة التحقق تحتوي على 53 صورة؛ يتم تضمين مجموعة الاختبار في التصدير لتقييم النموذج.
الاستخدام المباشر:https://go.hyper.ai/N0Yyg

3. مجموعة بيانات الفيديو SynCamVideo - مجموعة بيانات الفيديو المتزامن متعدد الكاميرات
تحتوي مجموعة البيانات على 1000 مشهد مختلف، تم التقاط كل منها بواسطة 36 كاميرا، مما أدى إلى إنشاء ما مجموعه 36 ألف مقطع فيديو، مع 50 حيوانًا مختلفًا كـ "مواضيع رئيسية" واستخدام 20 موقعًا مختلفًا من بولي هافن كخلفيات.
الاستخدام المباشر:https://go.hyper.ai/oIJns

4. مجموعة بيانات تصنيف صور الطائرات
تحتوي هذه المجموعة من البيانات على 3,371 صورة طائرة، مقسمة إلى 10 مجلدات فئات، كل فئة تتوافق مع طراز طائرة محدد: A10، A400M، AG600، AH64، AV8B، An124، An22، An225، An72 وB1، إلخ.
الاستخدام المباشر:https://go.hyper.ai/IL3uP

5. مجموعة بيانات صور القصص المصورة MangaZero
مجموعة بيانات MangaZero عبارة عن مجموعة بيانات صور هزلية كبيرة الحجم ومتعددة الشخصيات ومتعددة الحالات مصممة خصيصًا لمهام إنشاء القصص المصورة. يحتوي الكتاب على 43,264 صفحة من القصص المصورة و 427,147 لوحة توضيحية. إنه يدعم تصور تفاعلات الشخصيات المختلفة وأفعالها في إطارات متتالية وهو مناسب لمهام إنشاء القصص المصورة متعددة الشخصيات ومتعددة الحالات.
الاستخدام المباشر:https://go.hyper.ai/IpkjL
6. مجموعة بيانات التعرف الضوئي على الحروف (OCR) على الصيغ الرياضية في LaTeX
مجموعة بيانات LaTeX OCR هي مجموعة بيانات تركز على مشكلة التعرف على الصيغ الرياضية المعقدة في مجال التعرف الضوئي على الحروف (OCR). تحتوي مجموعة بيانات LaTeX OCR على تكوينات متعددة، كل منها يتميز بميزات وتقسيم بيانات مختلفين.
الاستخدام المباشر:https://go.hyper.ai/lyK1J
7. مجموعة بيانات الموقع مفتوحة المصدر لنظام التشغيل FSQ
تحتوي مجموعة البيانات هذه على أكثر من 100 مليون نقطة اهتمام عالمية (POIs)، تغطي أكثر من 200 دولة ومنطقة، مما يجعل البيانات الجغرافية المكانية الغنية متاحة للباحثين والمطورين والشركات. ويوفر 22 سمة أساسية، بما في ذلك معلومات رئيسية مثل اسم المكان والعنوان وخط الطول وخط العرض، والتي تدعم تطبيقات مختلفة مثل التحليل الجغرافي المكاني وخدمات تحديد المواقع.
الاستخدام المباشر:https://go.hyper.ai/7oN5M
8. مجموعة بيانات معايير التفكير الرياضي ProcessBench
تحتوي مجموعة البيانات هذه على 3.4 ألف مثال اختبار، تركز على مسائل الرياضيات المتعلقة بالمنافسة وصعوبة الأولمبياد. يأتي كل مثال مع حل خطوة بخطوة وعلامات خطأ دقيقة من قبل خبراء المجال.
الاستخدام المباشر:https://go.hyper.ai/fk3hq
تُعد مجموعة البيانات الطبية الصينية هذه موردًا شاملاً لتطوير وتدريب نماذج اللغة القادرة على تقديم محادثات وتوصيات مهنية في المجال الطبي. ويجمع هذا النموذج بين أنواع متعددة من البيانات، بما في ذلك المعرفة الموسوعية، ونصوص الكتب المدرسية، والمحادثات الفعلية بين الطبيب والمريض، وبيانات التقييم، لتحسين دقة النموذج وعمليته.
الاستخدام المباشر:https://go.hyper.ai/wkAXX
10. مجموعة بيانات تعليمية لتصحيح التباين وتصحيح عدم المحاذاة في splsoNet
spIsoNet هو برنامج تعليمي عميق ذاتي الإشراف من البداية إلى النهاية لمعالجة مشاكل تباين الخرائط وعدم محاذاة الجسيمات الناجمة عن مشكلة التوجيه المفضل. يتم استخدام هذه المجموعة من البيانات في الأبحاث، وتم نشر النتائج ذات الصلة في المجلة الأكاديمية الدولية Nature Methods.
الاستخدام المباشر:https://go.hyper.ai/tFOqJ
دروس تعليمية عامة مختارة
1. نشر Llama-3.3-70B-Instruct بنقرة واحدة
Llama-3.3-70B-Instruct هو نموذج لغوي كبير أطلقته Meta في عام 2024. وهو النموذج الوحيد مفتوح المصدر في سلسلة Llama 3.3، ويحتوي على إصدار مخصص لضبط التعليمات بدقة.
قام النموذج بتكوين البيئة والتبعيات. بإمكانك بدء محادثة مع النموذج عن طريق إدخال عنوان API.
تشغيل عبر الإنترنت:https://go.hyper.ai/TthEw

2. HunyuanVideo Tencent Hunyuan Wensheng فيديو تجريبي
يهدف HunyuanVideo إلى مساعدة المستخدمين في إنشاء محتوى فيديو عالي الجودة من خلال تقنية الذكاء الاصطناعي. HunyuanVideo هو نموذج فيديو Wensheng الذي يحتوي على أكبر عدد من المعلمات بين نماذج المصدر المفتوح الحالية، مع 13 مليار معلمة. يمكنه إنشاء محتوى فيديو بدقة فيزيائية عالية وتناسق المشهد، وتزويد المستخدمين بتجربة بصرية فائقة الواقعية، ويمكنه التبديل بحرية بين الأنماط الحقيقية والافتراضية.
يوفر المشروع واجهة ويب مريحة، ويمكن للمستخدمين إنشاء مقاطع فيديو بأنماط مختلفة بمجرد تقديم وصف نصي بسيط أو تحديد الشروط.
تشغيل عبر الإنترنت:https://go.hyper.ai/hEkOw

3. برنامج تريتون التعليمي: ضرب المصفوفات
في هذا البرنامج التعليمي، سوف تكتب نواة مضاعفة مصفوفة FP16 قصيرة للغاية وعالية الأداء تعمل بشكل مماثل لـ cuBLAS أو rocBLAS. على وجه التحديد، سوف تتعلم عن: ضرب المصفوفات متعددة المستويات؛ حساب المؤشر متعدد الأبعاد؛ إعادة ترتيب البرامج لتحسين معدلات الوصول إلى ذاكرة التخزين المؤقت L2؛ وضبط الأداء تلقائيًا.
تشغيل عبر الإنترنت:https://go.hyper.ai/riM7b

مقالات المجتمع
1. الذكاء الاصطناعي يُقوّض كيمياء المواد، مُلخّصًا أبرز نتائج الأبحاث العلمية في عام 2024
قامت HyperAI باختيار وتصنيف 26 ورقة بحثية متطورة تم تفسيرها خلال عامي 2023-2024. تسلط هذه المقالة الضوء على أبحاث الذكاء الاصطناعي في مجال كيمياء المواد. إنها مراجعة شاملة، لذا انقر هنا لقراءتها بسرعة.
شاهد التقرير الكامل:https://go.hyper.ai/XnzcN
باعتبارها شركة كيميائية بريطانية عالية التقنية، قامت شركة Chemify بتطوير أول "آلة تورينج الكيميائية" في العالم وأول مُجمِّع كيميائي في العالم. وهي ملتزمة بدمج الحوسبة الكيميائية والذكاء الاصطناعي والروبوتات والأتمتة وما إلى ذلك في البحث والتطوير الدوائي لتعزيز التنمية الرقمية للكيمياء. هذه المقالة عبارة عن تقرير مفصل عن الشركة، اضغط لقراءته بسرعة.
شاهد التقرير الكامل:https://go.hyper.ai/V5VWB
اقترح البروفيسور تو وي والبروفيسور لو فنغ وآخرون من جامعة هواتشونغ للعلوم والتكنولوجيا نموذجًا لتجزئة الصور الطبية يمكنه تحديد بؤر تجمع الخلايا الليمفاوية بدقة في الصور المرضية للمرضى المصابين بمتلازمة سجوجرن، مما يساعد الأطباء على إجراء تشخيصات أسرع وأكثر دقة. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.
شاهد التقرير الكامل:https://go.hyper.ai/EetpB
يجري فريق تشانغ شي شين في جامعة الصين للعلوم الجيولوجية (بكين) أبحاثًا حول أجهزة الاستشعار البصرية واللمسية منذ عام 2014. وقد استكشفوا وطوروا أجيالًا متعددة من تكنولوجيا الاستشعار وأطلقوا عليها اسم تكنولوجيا اللمس المتطورة، TactEdge. تعتبر هذه المقالة مقدمة تفصيلية لنتائج البحث ذات الصلة. انقر هنا لقراءته بسرعة.
شاهد التقرير الكامل:https://go.hyper.ai/nOE2a
5. مراجعة لتطورات الذكاء الاصطناعي في المجال الطبي في عام 2024، 35 بحثًا رائدًا لا يُمكنك تفويتها
تسلط هذه المقالة الضوء على أبحاث الذكاء الاصطناعي في مجال الرعاية الصحية. لقد قمنا باختيار 35 ورقة بحثية متطورة تم تفسيرها خلال الفترة 2023-2024 لتشاركها معكم بضائع فائقة الجودة. انقر للقراءة بسرعة.
شاهد التقرير الكامل:https://go.hyper.ai/CZdYT
اقترحت جامعة كاليفورنيا في بيركلي، ومايكروسوفت للأبحاث، وآخرون، طريقة توليد البروتين متعددة الوسائط PLAID، والتي يمكنها تحقيق توليد متعدد الوسائط عن طريق توليد وسائط أكثر ندرة من وسائط بيانات أكثر ثراءً. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.
شاهد التقرير الكامل:https://go.hyper.ai/nwnDy
مقالات موسوعية شعبية
1. وظيفة السيني
2. دمج الفرز المتبادل RRF
3. القاعدة النووية
4. نموذج اللغة الكبير
5. الذاكرة طويلة المدى
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!