HyperAI

اختيارات المحرر الأسبوعية | تم إطلاق مجموعة بيانات طبية من RJUA-QA، وتحليل ورقة نموذج التوليد الجزيئي ثلاثي الأبعاد ResGen

منذ عام واحد
معلومة
zhaorui
特色图像

عمود HyperAI الجديد هنا~كل يوم اثنين، سيقوم قسم التحرير في HyperNeural باختيار المحتوى (مجموعات البيانات، وحالات ورقية AI4S، وإدخالات الموسوعة) المحدثة على الموقع الرسمي hyper.ai في الأسبوع السابق ونشرها هنا. مرحبًا بكم لزيارة hyper.ai مباشرةً لعرض كافة المحتوى!

من 15 يناير إلى 21 يناير، تم تحديث الموقع الرسمي لـ hyper.ai بسرعة:

* مجموعات البيانات العامة عالية الجودة: 10

* حافظات ورق AI4S: 2

* إدخالات الموسوعة الشعبية: 10

قم بزيارة الموقع الرسمي:https://hyper.ai/

مجموعات البيانات العامة المختارة

1كروس دوك 2020:ريسجين  مجموعات البيانات المعالجة لأغراض البحث

تحتوي مجموعة البيانات الأولية على أكثر من 22 مليون زوج من البروتين والربيطة. يمكن استخدام مجموعة البيانات هذه في دراسات تفاعل البروتين مع الجزيئات الصغيرة، وخاصة لتقييم قدرة الجزيئات على الارتباط بجيوب البروتين.

الاستخدام المباشر:

https://hyper.ai/datasets/29021

2. RJUA-QA: أول مجموعة بيانات منطقية للإجابة على أسئلة التخصصات الطبية الصينية

RJUA-QA عبارة عن مجموعة بيانات مبتكرة للإجابة على الأسئلة في مجال تخصص جراحة المسالك البولية الطبية. تم إنشاء مجموعة البيانات من قبل فريق Ant Group Medical LLM بالتعاون مع فريق من خبراء أمراض المسالك البولية من مستشفى Renji التابع لكلية الطب بجامعة شنغهاي جياو تونغ. تم تطوير مجموعة البيانات لتحويل بيانات المرضى السريرية الحقيقية إلى محادثات سريرية افتراضية للمرضى، يتم تقديمها بتنسيق Q-context-A (سؤال-سياق-إجابة).

الاستخدام المباشر:

https://hyper.ai/datasets/28970

3. مجموعة بيانات الاستدلال الرياضي MetaMathQA

من أجل تحسين قدرات الاستدلال الأمامي والعكسي للنموذج، اقترح باحثون من كامبريدج وجامعة هونج كونج للعلوم والتكنولوجيا وهواوي مجموعة بيانات MetaMathQA استنادًا إلى مجموعتين بيانات رياضية مستخدمتين بشكل شائع (GSM8K وMATH): مجموعة بيانات استدلال رياضي ذات تغطية واسعة وجودة عالية. يتكون MetaMathQA من 395 ألف زوج من الأسئلة والأجوبة الرياضية الأمامية والعكسية التي تم إنشاؤها بواسطة نموذج لغوي كبير.

الاستخدام المباشر:

https://hyper.ai/datasets/28954

4. مجموعة بيانات ضبط التعليمات متعددة الأوضاع ومتعددة اللغات M³IT

تتكون مجموعة البيانات من 40 مجموعة بيانات تحتوي على 2.4 مليون مثيل و400 تعليمة مهمة مكتوبة يدويًا، وتم تنسيقها في بنية من الرؤية إلى النص. تجمع مجموعة البيانات مجموعة متنوعة من المهام من مهام الرؤية واللغة الكلاسيكية، بما في ذلك الترجمة التوضيحية، والإجابة على الأسئلة البصرية (VQA)، وتوليد الشرط البصري، والاستدلال، والتصنيف.

الاستخدام المباشر:

https://hyper.ai/datasets/29048

5. مجموعة بيانات حوار لعب الأدوار في ChatHaruhi-RolePlaying

ChatHaruhi عبارة عن مجموعة بيانات تحتوي على 32 شخصية تلفزيونية/أنمي صينية/إنجليزية وأكثر من 54 ألف حوار محاكي. حظيت روبوتات الدردشة التي تعتمد على لعب الأدوار والمصممة باستخدام نماذج لغوية كبيرة باهتمام واسع النطاق. ومن أجل تقليد شخصيات خيالية محددة، اقترح فريق البحث خوارزمية للتحكم في نموذج اللغة من خلال تحسين الإشارات وذاكرة الشخصيات المستخرجة من النصوص. ومن خلال جمع مجموعة من الأفلام والروايات والنصوص وإجراء استخلاص منظم، جمع فريق البحث أكثر من 23 ألف رسالة محادثة.

الاستخدام المباشر:

https://hyper.ai/datasets/28926

لمزيد من مجموعات البيانات المحدثة هذا الأسبوع، يرجى زيارة:

https://hyper.ai/datasets

العلوم والذكاء الاصطناعي  دعوىدراسات حالة مختارة

1. أسرع بثمانية مرات من أفضل التقنيات: هو تينغجون وآخرون. من جامعة تشجيانغ اقترح ResGen، وهو نموذج توليد جزيئي ثلاثي الأبعاد يعتمد على جيوب البروتين

جامعة تشجيانغ ومختبر تشيجيانغواقترح فريق البحث نموذجًا لتوليد الجزيئات ثلاثي الأبعاد يعتمد على جيوب البروتين - ResGen، وهو أسرع بـ 8 مرات من أفضل التقنيات السابقة ونجح في توليد جزيئات تشبه الأدوية مع طاقة ارتباط أقل وتنوع أعلى. وقد نُشرت الورقة البحثية في مجلة Nature.

شاهد التقرير الكامل:

https://hyper.ai/news/29026

2. اقترح فريق لوه شياوزو من الأكاديمية الصينية للعلوم إطار عمل UniKP، وهو نموذج كبير + التعلم الآلي للتنبؤ بمعلمات حركية الإنزيم بدقة عالية

اقترح فريق لوه شياوتشو من معهد شنتشن للتكنولوجيا المتقدمة، التابع للأكاديمية الصينية للعلوم، إطار عمل للتنبؤ بمعلمات حركية الإنزيم (UniKP) لتحقيق التنبؤ بمجموعة متنوعة من معلمات حركية الإنزيم المختلفة. وقد نُشرت الورقة البحثية في مجلة Nature.

شاهد التقرير الكامل:

https://hyper.ai/news/29000

مقالات موسوعية شعبية

1. وظيفة السيني

2. سلسلة ماركوف (سلسلة ماركوف)

3. هجوم الكلمات الإرشادية (الحقن الفوري)

4. نموذج المكافأة

5. الهندسة السريعة

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://hyper.ai/wiki

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد ترغب في تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة

* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 100 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai/