قم بنشر Phi 3.5 Mini+vision بنقرة واحدة! مجموعة بيانات معيار القراءة المتعددة الوسائط MRR-Benchmark متاحة على الإنترنت، وتتضمن 550 زوجًا من الأسئلة والأجوبة

تم لف النموذج الصغير مرة أخرى! مايكروسوفت تطلق ثلاثة إعلانات مفتوحة المصدر! أصدر Phi 3.5 ثلاثة نماذج لمهام مختلفة في وقت واحد، وتفوق على نماذج أخرى مماثلة في معايير متعددة.
ومن بينها، تم إطلاق Phi-3.5-mini-instruct خصيصًا للأجهزة ذات الذاكرة أو قوة الحوسبة المحدودة. يمكنه إظهار قدرات التفكير القوية حتى مع المعلمات الصغيرة، ويمكنه التعامل بسهولة مع المهام مثل إنشاء التعليمات البرمجية وفهم اللغات المتعددة. يعد Phi-3.5-vision-instruct رائدًا في مجال الوسائط المتعددة، فهو قادر على معالجة النصوص والمعلومات المرئية في وقت واحد، ويمكنه التعامل بسهولة مع المهام مثل فهم الصور وتلخيص الفيديو.
أطلقت HyperAI Super Neural Network الآن دروس نشر النموذج للإصدار الصغير وإصدار الرؤية. قم بالتمرير لأسفل للحصول على الرابط~
من 2 سبتمبر إلى 6 سبتمبر، تحديثات الموقع الرسمي لـhyper.ai:
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3
* مجموعات البيانات العامة عالية الجودة: 10
* اختيار المقالات المجتمعية: 3 مقالات
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات مع الموعد النهائي في سبتمبر: 5
قم بزيارة الموقع الرسمي:هايبر.اي
أود أن أوصيكم بنشاط تبادل أكاديمي عبر الإنترنت.سيقدم زيي تشو، باحث ما بعد الدكتوراه في جامعة شنغهاي جياو تونغ، محاضرة بعنوان "طرق التعلم باستخدام عينات صغيرة لنماذج لغة البروتين".أحضر معلومات عملية لمشاركتها، انقر لتحديد موعد للمشاهدة⬇️
دروس تعليمية عامة مختارة
1. نشر Phi-3.5-mini-instruct بنقرة واحدة
يدعم Phi-3.5-mini-instruct طول سياق يبلغ 128 ألف رمز وهو مناسب لمهام مثل إنشاء التعليمات البرمجية وحل المشكلات الرياضية والاستدلال القائم على المنطق. يحقق النموذج أداءً جيدًا في مهام الحوار متعددة اللغات ومتعددة الأدوار، ويتفوق على النماذج الأخرى من نفس المستوى في معيار RepoQA. يعد هذا البرنامج التعليمي عرضًا توضيحيًا لنشر النموذج بنقرة واحدة. كل ما عليك فعله هو استنساخ الحاوية وبدء تشغيلها ونسخ عنوان API الناتج مباشرةً لتجربة استنتاج النموذج.
الاستخدام المباشر:https://go.hyper.ai/F7smR
2. نشر Phi-3.5-vision-instruct بنقرة واحدة
يتمتع نموذج Phi-3.5-vision-instruct بقدرات واسعة مثل فهم الصور والتعرف الضوئي على الحروف (OCR) وتحليل المخططات والجداول وتلخيص الصور المتعددة أو مقاطع الفيديو، مما يجعله مناسبًا لمجموعة متنوعة من التطبيقات التي تعتمد على الذكاء الاصطناعي. أثبت مكاسب كبيرة في الأداء في المعايير المتعلقة بمعالجة الصور والفيديو. لقد تم نشر النموذج والبيئة. بإمكانك استخدام النموذج الكبير مباشرةً لتوليد الاستدلال وفقًا لإرشادات البرنامج التعليمي.
الاستخدام المباشر:https://go.hyper.ai/zN9Bx
LongWriter هو مشروع مفتوح المصدر تم تطويره بواسطة جامعة تسينغهوا والذي يقوم بإنشاء نصوص طويلة جدًا (أكثر من 10000 كلمة) باستخدام نموذج لغة كبير السياق الطويل (LLM). يعد هذا البرنامج التعليمي عرضًا توضيحيًا لنشر النموذج بنقرة واحدة. كل ما عليك فعله هو استنساخ الحاوية وبدء تشغيلها ونسخ عنوان API الناتج مباشرةً لتجربة استنتاج النموذج.
الاستخدام المباشر:https://go.hyper.ai/p6SiO
مجموعات البيانات العامة المختارة
1. مجموعة بيانات معيار القراءة متعدد الوسائط MRR-Benchmark
يتضمن معيار القراءة المتعددة الوسائط (MMR) 550 زوجًا من الأسئلة والأجوبة الموضحة في 11 مهمة مختلفة تغطي النص والخطوط والعناصر المرئية والمربعات المحددة والعلاقات المكانية والحقيقة الأساسية مع مقاييس تقييم مصممة جيدًا.
الاستخدام المباشر:https://go.hyper.ai/deAmf
2. مجموعة بيانات تقدير قطر حدقة العين EveDentify
تحتوي مجموعة البيانات على إجمالي 212,073 صورة لـ 51 مشاركًا. استخدم فريق البحث جهاز تعقب العين Tobii لجمع قياسات دقيقة لقطر حدقة العين أثناء استخدام كاميرا ويب مدمجة لالتقاط مقاطع فيديو للوجه. تهدف مجموعة البيانات إلى معالجة نقص مجموعات البيانات المتاحة لتقدير قطر حدقة العين باستخدام صور كاميرا الويب العادية.
الاستخدام المباشر:https://go.hyper.ai/iHjxC
3. مجموعة بيانات الكشف عن أجسام الطرق المرورية البولندية
تحتوي مجموعة البيانات هذه على 11 ألف صورة توضيحية للطرق البولندية، تم اختيارها خصيصًا لمهمة اكتشاف الكائنات. تم جمع البيانات باستخدام كاميرات مثبتة على السيارات على الطرق البولندية، وخاصة في كراكوف. التقطت الصور مجموعة متنوعة من المشاهد، بما في ذلك أنواع الطرق المختلفة وظروف الإضاءة المختلفة (الليل والنهار).
الاستخدام المباشر:https://go.hyper.ai/Sl0k5
4. مجموعة بيانات الكشف عن الأشخاص في سيناريوهات الكوارث
تحتوي مجموعة بيانات C2A (المدمجة مع التطبيق) على إجمالي 10215 صورة عالية الدقة لأربعة أنواع من مشاهد الكوارث (الحريق / الدخان، الفيضان، انهيار المبنى / الأنقاض، وحادث مروري) وخمس فئات من وضعية الإنسان (الانحناء، الركوع، الاستلقاء، الجلوس، والوقوف منتصبًا)، مع دقة صور تتراوح من 123 × 152 إلى 5184 × 3456 بكسل، وأكثر من 360.000 حالة بشرية موضحة.
الاستخدام المباشر:https://go.hyper.ai/15dMR
5. مجموعة بيانات Skin Conditionsmage 6 مجموعات بيانات لحالات الجلد
تحتوي مجموعة البيانات على صور محسنة لستة أمراض جلدية مختلفة: حب الشباب، والسرطان، والأكزيما، والتقرن، والميليا، والوردية. تحتوي كل فئة على 399 صورة، بإجمالي 2,394 صورة.
الاستخدام المباشر:https://go.hyper.ai/tWO7x
6. مجموعة بيانات اكتشاف المشاة وتقسيمهم في جامعة بنسلفانيا-فودان
تحتوي مجموعة البيانات هذه على 170 صورة RGB عالية الدقة تم التقاطها من تسلسلات الفيديو، ويوجد من 0 إلى 6 أهداف للمشاة في كل صورة. يتم تحديد موضع كل مشاة بدقة بواسطة مربع مستطيل (قناع)، مما يوفر معلومات إحداثيات المربع المحدد لتسهيل تدريب اكتشاف الكائنات واختبارها.
الاستخدام المباشر:https://go.hyper.ai/1CqaN
7. مجموعة بيانات Tecnalia الطيفية لنفايات المعدات الكهربائية
تحتوي مجموعة بيانات Tecnalia الطيفية الفائقة على كسور معدنية غير حديدية مختلفة من نفايات المعدات الكهربائية والإلكترونية، مثل النحاس والبرونز والألمنيوم والفولاذ المقاوم للصدأ والنيكل النحاسي، وتحتوي الصور على 76 طول موجي موزعة بالتساوي في النطاق الطيفي [415.05 نانومتر، 1008.10 نانومتر].
الاستخدام المباشر:https://go.hyper.ai/1TBGz
8. التنبؤ بحوادث السيارات مجموعة بيانات حوادث السيارات أو التنبؤ بها
تحتوي مجموعة البيانات هذه على 10 آلاف صورة لكاميرات السيارات، وكلها من 100 ألف مقطع فيديو لكاميرات السيارات. يتم فصل الصور عن الفيديو بفاصل زمني مدته 5 ثوانٍ كإطارات فردية، وتحتوي مجموعة البيانات على فئتين: التصادم وعدم التصادم. تتم توفير التعليقات التوضيحية أيضًا في ملف xlsx.
الاستخدام المباشر:https://go.hyper.ai/jV1hL
9. مجموعة بيانات عيوب لوحات الدوائر المطبوعة PKU-Market-PCB
PKU-Market-PCB عبارة عن مجموعة بيانات PCB اصطناعية عامة تحتوي على 1386 صورة مع 6 أنواع من العيوب (ثقوب متسربة، لدغات الفئران، فتحات، ماس كهربائي، شاردة، ونحاس شارد) والتي يمكن استخدامها لمهام اكتشاف الصور وتصنيفها وتسجيلها.
الاستخدام المباشر:https://go.hyper.ai/VnbpT
10. مجموعة بيانات تجزئة عيوب سطح شاشة الهاتف المحمول PKU-Market-Phone
تحتوي مجموعة البيانات هذه على 3 أنواع من عيوب السطح: بقع الزيت والخدوش والبقع. يوجد 400 صورة لكل نوع من أنواع العيوب، بإجمالي 1.2 ألف صورة. تم إنشاء العيوب من قبل فريق البحث لمحاكاة البيئة الصناعية. يتم التقاط الصور بواسطة كاميرا صناعية بدقة 1920×1080. يتم تقسيم مجموعة البيانات إلى تدريب: التحقق: اختبار = 6:2:2، ويستخدم تنسيق مجموعة البيانات PASCAL VOC.
الاستخدام المباشر:https://go.hyper.ai/K6u2o
لمزيد من مجموعات البيانات العامة، يرجى زيارة:
مقالات المجتمع
في الآونة الأخيرة، في حدث مدرسة الذكاء الاصطناعي للهندسة الحيوية الصيفية بجامعة شنغهاي جياو تونغ، قام الدكتور تشونج بوزيتاو بفرز تجربة التعلم الخاصة به بشكل منهجي تحت عنوان "AlphaFold 3: المبادئ والتطبيقات والآفاق"، وقام بفرز العديد من نتائج الأبحاث ذات الصلة من مجتمع البحث العلمي على نطاق واسع، ومشاركة رؤيته العميقة في AlphaFold 3 مع الجميع. تعتبر هذه المقالة ملخصًا للمحتوى الأساسي للخطاب.
شاهد التقرير الكامل:https://go.hyper.ai/Ln2Yv
واقترح فريق جامعة فودان تصميمًا جديدًا لمطياف إعادة البناء المصغر يجمع بين مزايا مطياف إعادة البناء التقليدي ومطياف إعادة البناء الحاسوبي. من خلال قناة مرشح النطاق الضيق المرجعية الذاتية المتكاملة، يمكن لخوارزمية الذكاء الاصطناعي البحث في وقت واحد عن المعلمات الطيفية والخوارزمية في مساحة معلمات ذات أبعاد أعلى. هذه المقالة عبارة عن تفسير مفصل ومشاركة لورقة البحث.
شاهد التقرير الكامل:https://go.hyper.ai/GEKE4
أصدر مختبر الذكاء الاصطناعي في شنغهاي نموذج اللغة الكيميائية الكبيرة ChemLLM. يتفوق برنامج ChemLLM في أداء المهام المختلفة في مجال الكيمياء من خلال التفاعلات المحادثة السلسة، والأداء على قدم المساواة مع GPT-4 في المهام الأساسية وإظهار أداء مماثل لبرنامج LLMs ذي الحجم المماثل في السيناريوهات العامة. هذه المقالة عبارة عن تفسير مفصل ومشاركة لورقة البحث.
شاهد التقرير الكامل:https://go.hyper.ai/3bdMW
مقالات موسوعية شعبية
1. دمج الفرز المتبادل RRF
2. معدل التعلم
3. القاعدة النووية
4. جبهة باريتو
5. زيادة البيانات
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1300 مجموعة بيانات عامة
* يتضمن أكثر من 400 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: