تم تعبئة قاعدة البيانات التابعة لـ Alphafold3 وإطلاقها! ورقة التقييم الكاملة لاختبار ICLR IC-Light: تحديد سمات درجة الضوء بدقة

لقد أحدث AlphaFold2 ضجة كبيرة في مجال AI4S منذ إصداره، بل وفاز بجائزة نوبل لهذا العام. وباعتبارها النسخة المطورة، لا يستطيع AlphaFold3 التنبؤ ببنية البروتينات فحسب، بل يمكنه أيضًا التنبؤ ببنية التفاعلات بين البروتينات والجزيئات البيولوجية الأخرى المختلفة، بما في ذلك كيفية تجمع الربيطة (الجزيئات الصغيرة) والأحماض النووية (DNA وRNA) معًا وتفاعلها مع بعضها البعض.
في الشهر الماضي فقط، قامت Google DeepMind بفتح مصدر أوزان نموذج AlphaFold3 وقاعدة بيانات التبعيات الخاصة به للبحث الأكاديمي. أطلقت HyperAl الآن قاعدة بيانات التبعيات AlphaFold3. الجميع مدعوون لتجربة الإنجازات التكنولوجية التي جلبها AlphaFold3 أثناء قراءة المقال!
الاستخدام عبر الإنترنت:https://go.hyper.ai/wVItz
من 9 ديسمبر إلى 13 ديسمبر، تحديثات الموقع الرسمي لـhyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3
* اختيار المقالات المجتمعية: 5 مقالات
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات التي لها مواعيد نهائية في يناير: 9
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. يعتمد Alphafold3 على قاعدة البيانات
تحتوي قاعدة البيانات على عدد كبير من قواعد بيانات البروتين والـRNA التي يعتمد عليها AlphaFold 3، بما في ذلك 9 قواعد بيانات: BFD small، وMGnify، وPDB، وPDB seqres، وUniProt، وUniRef90، وNT، وRFam، وRNACentral.
الاستخدام المباشر:https://go.hyper.ai/wVItz
2. مجموعة بيانات تعليمات الجزيئات الحيوية واسعة النطاق
تحتوي مجموعة البيانات على ثلاثة أنواع من التعليمات: تعليمات موجهة للجزيئات، وتعليمات موجهة للبروتين، وتعليمات نصية للجزيئات الحيوية. ويهدف إلى توفير بيانات تعليمية غنية لتعزيز قدرات الفهم والتنبؤ بنماذج اللغة الكبيرة في مجال الجزيئات الحيوية.
الاستخدام المباشر:https://go.hyper.ai/Gut1y

3. مجموعة بيانات تحويل النصوص المحادثة إلى SQL من CoSQL
يحتوي CoSQL على أكثر من 3 آلاف مجموعة من المحادثات، وإجمالي أكثر من 10 آلاف استعلام SQL مُعلّق، تمتد عبر 200 قاعدة بيانات، وقواعد البيانات التي تستخدمها مجموعات مختلفة من البيانات ليس لها تقاطع، من أجل فحص قوة النموذج.
الاستخدام المباشر:https://go.hyper.ai/9Blzy

4. مجموعة بيانات QAngaroo لمهارات فهم القراءة والاستدلال متعدد الخطوات
تتكون مجموعة البيانات من جزأين: WikiHop وMedHop، والتي تهدف إلى بناء طريقة فهم القراءة التي يمكنها إجراء استدلال متعدد القفزات، أي أن الحقائق المنتشرة في مستندات مختلفة تتطلب خطوات متعددة من الاستدلال لاستخلاص حقائق جديدة.
الاستخدام المباشر:https://go.hyper.ai/u1qRw

5. مجموعة بيانات كتب الطب الصيني التقليدي القديمة
تحتوي مجموعة البيانات هذه على حوالي 700 نص في الطب الصيني القديم، تغطي الكلاسيكيات الطبية من فترة ما قبل أسرة تشين إلى أواخر أسرة تشينغ وجمهورية الصين. لا تتضمن هذه الوثائق النظريات الطبية والوصفات الطبية وعلم الأدوية وما إلى ذلك فحسب، بل تحتوي أيضًا على حالات سريرية غنية ومعرفة موسوعية طبية.
الاستخدام المباشر:https://go.hyper.ai/8Vh6A
6. مجموعة بيانات الرعاية الصحية IndustryCorpus2 الفرعية
تُعد مجموعة البيانات هذه مكتبة موارد بيانات عالية الجودة مخصصة خصيصًا للبحث والتطبيق في مجال الصحة الطبية. لقد خضعت لعملية فحص وتنظيف صارمة لضمان دقة وموثوقية البيانات. ويغطي مجموعة واسعة من أنواع البيانات في مجال الرعاية الصحية، بما في ذلك السجلات الطبية والأدبيات الطبية وردود أفعال المرضى، مما يوفر للباحثين والمطورين منظورًا شاملاً للاستكشاف والابتكار.
الاستخدام المباشر:https://go.hyper.ai/G9qn2
7. مجموعة بيانات معيارية متعددة اللغات ومتعددة المهام P-MMEval
تحتوي مجموعة البيانات على 3 مجموعات بيانات أساسية لمعالجة اللغة الطبيعية (NLP) و5 مجموعات بيانات متقدمة خاصة بالقدرات، تغطي مهام مثل إنشاء التعليمات البرمجية وفهم المعرفة والاستدلال الرياضي والاستدلال المنطقي واتباع التعليمات.
الاستخدام المباشر:https://go.hyper.ai/qbzhv
8. مجموعة بيانات ShenNong TCM مجموعة بيانات ShenNong TCM
تحتوي مجموعة البيانات هذه على أكثر من 110,000 من بيانات التعليمات، والتي يتم إنشاؤها من خلال طريقة التعليم الذاتي التي تركز على الكيان. يركز على الكيانات الأساسية وسيناريوهات النوايا المختلفة في مجال الطب الصيني التقليدي. لا يمكنه فقط تحسين قدرة النموذج على الإجابة على الأسئلة المتعلقة بالطب الصيني التقليدي، بل يساعد أيضًا في تشخيص الطب الصيني التقليدي وتقديم المشورة الطبية الشخصية.
الاستخدام المباشر:https://go.hyper.ai/Okruv
9. مجموعة بيانات معيارية لتوليد الكود DS-1000
تحتوي مجموعة البيانات على 1000 سؤال في علوم البيانات في العالم الحقيقي من StackOverflow، والتي تغطي 7 مكتبات علوم بيانات مستخدمة على نطاق واسع في Python، مثل NumPy وPandas وTensorFlow وما إلى ذلك.
الاستخدام المباشر:https://go.hyper.ai/AL4h0
10. IndustryCorpus2-tourism-geography مجموعة بيانات جغرافية السياحة
تُعد مجموعة البيانات هذه جزءًا من مجموعة بيانات جغرافية السياحة في IndustryCorpus2، والتي تغطي مجموعة واسعة من أنواع البيانات في مجال جغرافية السياحة، بما في ذلك مقدمات الجذب السياحي، وأدلة السفر، ومراجعات السياح، والمعلومات الجغرافية، مما يوفر سيناريوهات تطبيق غنية لمختلف مجالات البحث والتطبيق مثل معالجة اللغة الطبيعية، والتعلم الآلي، واستخراج البيانات، وأنظمة توصية السياحة.
الاستخدام المباشر:https://go.hyper.ai/FIAM9
دروس تعليمية عامة مختارة
1. عرض توضيحي لإنشاء فيديو Allegro
يتمتع Allegro بالقدرة على تحويل النص الأساسي المدخل إلى محتوى فيديو عالي الدقة، بدقة 720 بكسل، و15 إطارًا في الثانية، وطول فيديو أقصى يبلغ 6 ثوانٍ. ويظهر النموذج أداءً ممتازًا في مجال تركيب الفيديو، حيث يتفوق في الجودة والترابط الزمني.
هذا البرنامج التعليمي هو برنامج تعليمي للاستدلال النموذجي. نظرًا لأن الأمر يستغرق وقتًا طويلاً حتى يتمكن النموذج من إنشاء مقطع فيديو، فيمكن لهذا البرنامج التعليمي إنشاء تأثير فيديو مدته 5 ثوانٍ.
تشغيل عبر الإنترنت:https://go.hyper.ai/MgUVZ

2. IC-Light v2: عرض توضيحي لترقية التحكم في الإضاءة بالذكاء الاصطناعي
IC-Light هو اختصار لـ Imposing Consistent Light (فرض الإضاءة المتسقة)، وهو مشروع يهدف إلى تحقيق إعادة إضاءة الصور من خلال نماذج التعلم الآلي. يعد هذا البرنامج التعليمي نسخة مطورة من IC-Light v2. بالمقارنة مع IC-Light الأصلي، تم تدريب هذا الإصدار على أساس نموذج Flux، مما يمكّنه من تحديد خصائص الإضاءة والنغمة للصورة بشكل أكثر دقة وتحقيق تأثير اندماج أكثر تفصيلاً وواقعية.
انقر على الرابط أدناه واتبع البرنامج التعليمي للتحكم في تأثيرات الإضاءة في صورتك.
تشغيل عبر الإنترنت:https://go.hyper.ai/hg0cM

3. Hunyuan3D: إنشاء أصول ثلاثية الأبعاد في 10 ثوانٍ فقط
Hunyuan3D هو نموذج انتشار توليدي ثلاثي الأبعاد، يتضمن إصدارًا خفيف الوزن وإصدارًا قياسيًا، وكلاهما يدعم إنشاء أصول ثلاثية الأبعاد عالية الجودة من مدخلات النصوص والصور. بعد التقييم متعدد الأبعاد النوعي والكمي، أظهر Hunyuan3D-1.0 أداءً جيدًا للغاية من حيث التفاصيل الهندسية، وتفاصيل الملمس، وتناسق الملمس والهندسة، والعقلانية ثلاثية الأبعاد، والامتثال للتعليمات.
يعد هذا البرنامج التعليمي نسخة خفيفة الوزن من Hunyuan3D. انقر على الرابط أدناه واتبع تعليمات البرنامج التعليمي لتجربة إنشاء نموذج ثلاثي الأبعاد.
تشغيل عبر الإنترنت:https://go.hyper.ai/Rsrno

مقالات المجتمع
باعتبارها شركة ناشئة، لا ينبغي الاستهانة بقوة CuspAI. وصلت جولة التمويل التأسيسية الخاصة بها إلى 30 مليون دولار أمريكي، لتصبح واحدة من أكبر جولات التمويل التأسيسي في أوروبا في ذلك العام. وبالإضافة إلى ذلك، يعد خبير التعلم الآلي ماكس ويلينج أحد المؤسسين المشاركين للشركة، كما أن جيفري هينتون الحائز على جائزة نوبل وجائزة تورينج هو مستشار مجلس إدارة شركته. تعتبر هذه المقالة مقدمة مفصلة لـ CuspAI.
شاهد التقرير الكامل:https://go.hyper.ai/3fQFG
مع التطبيق الواسع النطاق لتكنولوجيا الذكاء الاصطناعي في حياتنا اليومية، أصبحت "قابلية تفسير" النماذج تدريجيا قضية تحتاج إلى معالجة عاجلة. تبرز هذه المشكلة بشكل خاص في مهام التنبؤ بالسلاسل الزمنية. من أجل جعل التنبؤ بالسلسلة الزمنية عملية "مرئية"، اقترح فريق لو فينج من جامعة هواتشونغ للعلوم والتكنولوجيا، بالتعاون مع فريق الأكاديمي زومايا من جامعة سيدني ومستشفى تونغجي، طريقة جديدة - CGS-Mask. من خلال الجمع بين التنبؤ بالسلسلة الزمنية والقدرة على التفسير، لا تستطيع هذه الطريقة تحسين دقة التنبؤ بالنموذج فحسب، بل تجعل نتائج التنبؤ أكثر سهولة في الفهم والتفسير. هذه المقالة عبارة عن تفسير مفصل ومشاركة للورقة.
شاهد التقرير الكامل:https://go.hyper.ai/TFEsd
اقترح فريق بحثي من جامعة ستانفورد ومعهد آرك في الولايات المتحدة نموذج Evo يعتمد على الجينوم، والذي نُشر كمقال رئيسي في مجلة Science. إنه يتيح التنبؤ بالرصاصة الصفرية والتوليد عالي الدقة في المهام المتعددة الوسائط للحمض النووي والحمض النووي الريبي والبروتين. قسم دروس HyperAI Hyper-Neural متاح الآن على الإنترنت بعنوان "Evo: التنبؤ والتوليد من المقياس الجزيئي إلى الجينومي"، والذي يمكن تجربته بسرعة من خلال الاستنساخ بنقرة واحدة!
شاهد التقرير الكامل:https://go.hyper.ai/5WPGm
وُلِد عراب الذكاء الاصطناعي هينتون في عائلة من العباقرة، لكنه كان من المتسربين من الدراسة؛ كانت شركته الناشئة تضم 3 أشخاص فقط، ولكن تم الاستحواذ عليها من قبل شركة جوجل مقابل 44 مليون دولار؛ لقد أمضى ما يقرب من نصف قرن في تطوير الشبكات العصبية، لكنه أعرب بصراحة عن ندمه... ما هي نوعية التجارب الحياتية التي جعلته ما هو عليه اليوم؟ تعتبر هذه المقالة تقريراً مفصلاً عن هينتون.
شاهد التقرير الكامل:https://go.hyper.ai/EHWs6
vLLM هو إطار عمل مصمم لتسريع عملية التفكير في نماذج اللغة الكبيرة، مما يحقق هدرًا شبه معدوم لذاكرة التخزين المؤقت KV. يقدم الإصدار الأحدث v0.6.4 جدولة متعددة الخطوات ومعالجة إخراج غير متزامنة، مما يعمل على تحسين استخدام وحدة معالجة الرسومات بشكل أكبر وتحسين كفاءة المعالجة. من أجل مساعدة المطورين المحليين على التعرف بسهولة أكبر على تحديثات إصدار vLLM والتطورات المتطورة، أكمل مجتمع HyperAI Super Neural توطين وثائق vLLM باللغة الصينية.
عرض وثائق vLLM الصينية:https://vllm.hyper.ai/
مقالات موسوعية شعبية
1. خلايا سيبستروم MFCCs ذات التردد الميلاني
2. دمج الفرز المتبادل RRF
3. نمذجة اللغة المقنعة (MLM)
4. جبهة باريتو
5. زيادة البيانات
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!