اختيارات المحرر الأسبوعية | مجموعة أدوات التفكير الرياضي MathPile مفتوحة المصدر، مستشفى Union Eye Hospital يقود استخدام الذكاء الاصطناعي للمساعدة في اكتشاف 13 مرضًا في قاع العين

في الآونة الأخيرة، تم افتتاح مختبر أبحاث الذكاء الاصطناعي التوليدي (GAIR) التابع لجامعة شنغهاي جياو تونغمجموعة البيانات MathPile المدربة مسبقًا والمتنوعة والعالية الجودة، والمصممة خصيصًا لمجال الرياضيات، ونسختها التجارية MathPile-Commercial مفتوحة المصدر.أصبح الآن متاحًا للتنزيل على الموقع الرسمي لـhyper.ai! هناك المزيد مثل ماثفيستا ، Math23K ومجموعات البيانات الرياضية الشهيرة الأخرى في انتظارك لاستخدامها~
من 19 فبراير إلى 23 فبراير، تحديثات الموقع الرسمي لـ hyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* حافظات ورق AI4S: 4
* إدخالات الموسوعة الشعبية: 10
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة نصوص MathPile المُدرَّبة مسبقًا للاستدلال الرياضي
أطلق مختبر الذكاء الاصطناعي التوليدي بجامعة شنغهاي جياو تونغ مجموعة بيانات MathPile. هذه مجموعة متنوعة وعالية الجودة تم تدريبها مسبقًا خصيصًا لمجال الرياضيات، وتحتوي على ما يقرب من 9.5 مليار رمز، وهي مصممة لتعزيز قدرات التفكير الرياضي للنماذج الكبيرة.
الاستخدام المباشر:
https://hyper.ai/datasets/29543
2. MathPile - مجموعة أدوات تجارية للتدريب المسبق على التفكير الرياضي (النسخة التجارية)
MathPile-Commercial هو إصدار تجاري من MathPile، تم الحصول عليه عن طريق إزالة المستندات الموجودة في MathPile والتي تحظر الاستخدام التجاري (الإصدار الأحدث، v0.2). وعلى وجه التحديد، قام فريق البحث باختبار بيانات المصدر للاستخدام غير التجاري، باستخدام معلومات الترخيص في البيانات الوصفية لمصدر arXiv وتطبيق مطابقة الكلمات الرئيسية على مصادر أخرى.
الاستخدام المباشر:
https://hyper.ai/datasets/29545
3. مجموعات بيانات الصور المولدة بالذكاء الاصطناعي
تحتوي مجموعة البيانات هذه على 19 صورة لأولاد تم إنشاؤها بواسطة Copilot. Copilot هو رفيق الذكاء الاصطناعي الذي ينشئ محتوى خياليًا ومبتكرًا. تعتبر هذه الصور مناسبة لمهام اكتشاف الوجوه والوضعيات لأنها تختلف في تعبيرات الوجه والوضعيات والخلفيات والإضاءة والانسدادات.
الاستخدام المباشر:
https://hyper.ai/datasets/29527
4. مجموعة بيانات متنوعة للصور الشخصية تم إنشاؤها بواسطة الذكاء الاصطناعي
تحتوي مجموعة البيانات على 140 صورة عالية الجودة تم إنشاؤها بعناية بواسطة خوارزميات الذكاء الاصطناعي المتقدمة، بما في ذلك 70 صورة شخصية للإناث و70 صورة شخصية للذكور. تُظهر كل صورة في مجموعة البيانات هذه قدرة الذكاء الاصطناعي المذهلة على محاكاة تعقيد المظهر البشري.
الاستخدام المباشر:
https://hyper.ai/datasets/29529
5. أخبار THUC مجموعة بيانات تصنيف النصوص الصينية
يتم إنشاء THUCNews عن طريق تصفية البيانات التاريخية لقناة اشتراك RSS الخاصة بـ Sina News من عام 2005 إلى عام 2011، ويحتوي على 740,000 مستند إخباري (2.19 جيجابايت)، كلها بتنسيق نص عادي UTF-8. وبناءً على نظام تصنيف أخبار سينا الأصلي، أعاد فريق البحث تنظيمه وتقسيمه إلى 14 فئة مرشحة: التمويل، واليانصيب، والعقارات، والأسهم، والمنزل، والتعليم، والتكنولوجيا، والمجتمع، والأزياء، والشؤون الجارية، والرياضة، والأبراج، والألعاب، والترفيه.
الاستخدام المباشر:
https://hyper.ai/datasets/29521
6. مجموعة بيانات ShareGPT 90 ألفًا للإجابة على الأسئلة البشرية والآلية ثنائية اللغة باللغتين الصينية والإنجليزية
ShareGPT-Chinese-English-90k عبارة عن مجموعة بيانات عالية الجودة ثنائية اللغة للإجابة على أسئلة الإنسان والآلة باللغتين الصينية والإنجليزية، وتغطي بيانات أسئلة المستخدم في السيناريوهات الحقيقية والمعقدة. يمكن استخدام مجموعة البيانات هذه لتدريب نماذج المحادثة عالية الجودة.
الاستخدام المباشر:
https://hyper.ai/datasets/29523
7. مجموعة بيانات التعرف على نية المحادثة الصينية SMP-2017
تعتبر مجموعة البيانات هذه مجموعة بيانات مهمة 1 لتقييم تكنولوجيا الحوار بين الإنسان والحاسوب الصينية (ECDT) في مشروع SMP2017. ويهدف التقييم إلى تعزيز تطوير الأبحاث المتعلقة بأنظمة الحوار بين الإنسان والحاسوب الصينية.
الاستخدام المباشر:
https://hyper.ai/datasets/29515
8. مجموعة بيانات تصنيف نصوص توتياو
هذه المجموعة من البيانات هي مجموعة بيانات تصنيفية لأخبار توتياو الصينية (نص قصير). مصدر البيانات هو عميل Toutiao. يحتوي على 15 فئة و 382,688 نصًا، وموعد التجميع مايو 2018.
الاستخدام المباشر:
https://hyper.ai/datasets/29517
للحصول على المزيد من مجموعات البيانات المحدثة هذا الأسبوع، يرجى زيارة:
دراسات حالة علمية حول الذكاء الاصطناعي
يعتمد تشخيص أمراض العيون بشكل كبير على التعرف على الصور، ويعتبر طب العيون مناسبًا جدًا لتطبيق التقنيات مثل التعلم العميق. من أجل استكشاف القيمة المحتملة للتعلم العميق في تشخيص أمراض قاع العين بشكل أكبر، قاد تشين يو شين، مدير قسم طب العيون في مستشفى كلية الطب بجامعة بكين يونيون، تعاونًا بين خمسة مراكز لطب العيون في جميع أنحاء البلاد، وشركة بكين تشي يوان هويتو للتكنولوجيا المحدودة، والأستاذ لي زيرونغ من كلية المعلومات بجامعة رينمين في الصين لتطوير نظام التعلم العميق بشكل مشترك. يساعد النظام أطباء العيون المبتدئين على تحسين اتساق تشخيصهم بنحو 12% ويوفر طريقة جديدة للكشف التلقائي عن 13 مرضًا رئيسيًا في قاع العين. وقد نُشرت الورقة البحثية ذات الصلة في مجلة "Nature".
شاهد التقرير الكامل:
إن تأثير البيئة الإيكولوجية على صحة الإنسان دقيق. استخدمت مجموعة البحث التابعة للبروفيسور وو شيفينج من كلية الصحة العامة بجامعة تشجيانغ نموذج الشبكة العصبية التلافيفية لتقييم التعرض الأخضر المرئي استنادًا إلى مؤشر العرض الأخضر لصور عرض الشارع، ثم استكشفت ما إذا كان هناك ارتباط مفيد بين مستوى المساحات الخضراء المرئية في مكان العمل ومتلازمة التمثيل الغذائي لدى البالغين. استخدم فريق البحث نموذج الانحدار اللوجستي لتقييم مستوى المساحات الخضراء المرئية في الهواء الطلق في بيئة العمل لأكثر من 50 ألف بالغ في هانغتشو وأكد الارتباط المفيد بين الاثنين. وقد نشرت النتائج ذات الصلة في مجلة "البيئة الدولية".
شاهد التقرير الكامل:
معهد الذكاء الاصطناعي بجامعة شنغهاي جياو تونغ الذكاء الاصطناعي للعلوم واقترح البروفيسور يانغ شياوكانغ وآخرون في الفريق مفهومًا لبناء مرافق علمية ذكية، وتشكيل وظائف مبتكرة مثل النماذج الكبيرة في المجالات العلمية، والمحاكاة التوليدية والعكس، والتجارب الذكية غير المأهولة المستقلة، والتعاون البحثي العلمي الموثوق به على نطاق واسع. وقد تم نشر نتائج الأبحاث ذات الصلة في "مجلة الأكاديمية الصينية للعلوم".
شاهد التقرير الكامل:
4. تم اختيارها من قبل مهندسي أمازون، وهي عبارة عن مجموعة تضم أكثر من 40 ورقة بحثية في مجال LLM
بدأت المزيد والمزيد من الشركات والصناعات التقليدية في استكشاف كيفية تطبيق نماذج اللغة الكبيرة على أعمالها الخاصة. وقد أدى الطلب المتزايد بسرعة في السوق أيضًا إلى مزيد من التعميق والابتكار في الأبحاث في المجالات ذات الصلة، وأصبحت تحديثات الأوراق البحثية على منصات مثل arXiv أكثر تواترا. من أجل مساعدة الجميع على استرجاع الأوراق ذات القيمة العالية بشكل أسرع، قام مهندس أمازون يوجين يان وآخرون بإنشاء قائمة قراءة للأوراق النموذجية اللغوية لمشاركة الأوراق المتطورة بشكل مستمر. تم حاليًا تجميع أكثر من 40 ورقة بحثية عالية الجودة.
عرض ملخص الورقة البحثية كاملا:
مقالات موسوعية شعبية
1. التذكير معدل الاستدعاء
2. التعلم المعزز بالتغذية الراجعة البشرية مؤسسة RLHF
3. الذكاء الاصطناعي العام (AGI)
4. تعزيز الاسترجاع يولد RAG
5. مجال الإشعاع العصبي (NeRF)
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة
* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: