HyperAI

تقرير أسبوعي عن الذكاء الاصطناعي | أكبر مجموعة بيانات للمنطق الطبي، ReasonMed، تحتوي على 370,000 عينة؛ اقترحت مايكروسوفت وجامعة بكين وجامعة تسينغهوا تدريبًا مسبقًا للتعلم المعزز لتحسين دقة التنبؤ بالرمز التالي.

特色图像

مع التطور السريع لتكنولوجيا الذكاء الاصطناعي، تتدفق نتائج البحوث الأكاديمية والأوراق البحثية في سيل لا ينضب. ووفقًا للورقة البيضاء حول الذكاء العلمي 2025، تضاعف عدد الأوراق البحثية المنشورة في مجلات الذكاء الاصطناعي العالمية بأكثر من ثلاثة أضعاف خلال العقد الماضي، من 308,900 إلى 954,500. وخلف هذه البيانات الضخمة، لا تكمن حكمة الباحثين فحسب، بل تكمن أيضًا في قدرتهم على تجاوز الصعوبات واستكشاف المستقبل.
من بنية المحول التي أحدثت نقلة نوعية في نماذج اللغة، إلى نموذج الانتشار الذي أعاد تعريف إمكانيات توليد الصور؛ ومن التطبيق العميق للتعلم المعزز في مجال القيادة الذاتية، إلى التقدم الملحوظ في التشخيص الطبي بمساعدة الذكاء الاصطناعي... بدأت كل قفزة نوعية في مجال الذكاء الاصطناعي بسلسلة من الأوراق البحثية التي لخصت الحكمة. هذه الكنوز الأكاديمية القيّمة هي التي نسجت معًا في "الخريطة التقنية" التي تُحرك تطور هذه الصناعة.

لإطلاع المزيد من المستخدمين على أحدث التطورات في مجال الذكاء الاصطناعي في الأوساط الأكاديمية، أطلق الموقع الرسمي لشركة HyperAI (hyper.ai) قسم "أحدث الأبحاث"، الذي يُحدّث يوميًا أحدث الأبحاث في مجال الذكاء الاصطناعي، والتي تغطي مجالات متعددة، مثل التعلم الآلي، واللغة الحاسوبية، والرؤية الحاسوبية والتعرف على الأنماط، والتفاعل بين الإنسان والحاسوب. تفضلوا بزيارتنا.

أحدث أوراق الذكاء الاصطناعي:https://go.hyper.ai/owxf6

فيما يلي، اختارت HyperAI بعناية 5 أوراق بحثية شائعة في مجال الذكاء الاصطناعي، تم تحديثها من 9 إلى 13 يونيو. دعونا نتعلم معًا~

توصيات الورقة البحثية لهذا الأسبوع

1 التعزيز قبل التدريب

تقترح هذه الدراسة أسلوبًا جديدًا للتدريب المسبق لنموذج اللغة، وهو التدريب المسبق المُعزز (RPT)، الذي يُحوّل مهمة التنبؤ بالكلمة التالية إلى مهمة استدلال، ويستخدم التعلم المُعزز للتدريب لتشجيع النموذج على التنبؤ الصحيح بالكلمة التالية بناءً على سياق مُحدد. تُظهر النتائج التجريبية أن التدريب المسبق المُعزز لا يُحسّن دقة التنبؤ لنموذج اللغة بشكل كبير فحسب، بل يُوفر أيضًا أساسًا أقوى للضبط الدقيق اللاحق للتعلم المُعزز، مما يُحسّن الأداء في مهام تعلم النقل من الصفر.

رابط الورقة:https://go.hyper.ai/Pxpgk

مخطط معماري للنموذج
خريطة ذهنية ورقية

2 الثقة هي كل ما تحتاجه: ضبط دقيق لنماذج اللغة باستخدام التعلم التعزيزي في لقطات قليلة

تُقدّم هذه الدراسة أسلوبًا للتعلم التعزيزي باستخدام نماذج لغوية كبيرة (LLMs)، ألا وهو الضبط الدقيق للنموذج غير المُشرف عليه من خلال الثقة بالنفس (RLSC). تُظهر النتائج التجريبية أنه باستخدام عدد قليل من العينات (16 عينة لكل سؤال و10 أو 20 خطوة تدريبية)، يُمكن لهذه الطريقة تحسين دقة النموذج بشكل ملحوظ في مهام التفكير الرياضي المتعددة.

رابط الورقة:https://go.hyper.ai/rFuVl

مخطط معماري للنموذج
خريطة ذهنية ورقية

3 هل سيظل هذا صحيحًا غدًا؟ سؤالٌ دائمٌ متعدد اللغات التصنيف للتحسين  ضمان الجودة جدير بالثقة

تقترح هذه الدراسة طريقة جديدة لتقييم وتحسين أداء نماذج اللغة الكبيرة (LLMs) في مهام الإجابة على الأسئلة، مع التركيز بشكل خاص على حساسية الأسئلة للوقت أو ما إذا كانت أسئلة "خالدة". تُظهر الدراسة أن قدرة EG-E5 على تقييم الأسئلة "الخالدة" تتفوق على جميع النماذج المُختبرة. وتُظهر أبحاث أخرى أنه عند استخدام مؤشرات عدم اليقين لتقييم معرفة نماذج اللغة الكبيرة، فإن دمج المعلومات الاحتمالية للأسئلة "الخالدة" يُمكن أن يُحسّن جودة ودقة التقييم بشكل كبير.

رابط الورقة:https://go.hyper.ai/zOGjT

مقدمة الورقة
خريطة ذهنية ورقية

4 ReasonMed: برنامج متعدد الوكلاء بقيمة 370 ألف دولار  مجموعة بيانات مُولَّدة للتقدم  المنطق الطبي

تُقدّم هذه الدراسة مجموعة بيانات استدلال طبي واسعة النطاق (ReasonMed) مُولّدة بواسطة نظام متعدد الوكلاء، بهدف تحسين قدرة الإجابة على الأسئلة الطبية استنادًا إلى نماذج لغوية. تُولّد مجموعة البيانات هذه من خلال ما يقارب 1.7 مليون مسار استدلال أولي عبر نماذج لغوية كبيرة مختلفة، وبعد تحقّق دقيق وتحسين، تُحسّن في النهاية إلى 370,000 مثال عالي الجودة. كما تستكشف المقالة تأثير استراتيجيات التدريب المتعددة على أداء نماذج الاستدلال الطبي، وتجد أن الطريقة الهجينة التي تجمع بين استدلال التفكير المتسلسل المفصل (CoT) وتلخيص الإجابات الموجز هي الأكثر فعالية.

رابط الورقة:https://go.hyper.ai/XyO0s

مقدمة الورقة
خريطة ذهنية ورقية

5 UniSim: محاكي موحد لـ  ديناميكيات الزمن الخشنة  من الجزيئات الحيوية

تُقدّم هذه الدراسة نموذجًا جديدًا للتعلم العميق، وهو المُحاكي المُوحّد (UniSim)، والذي يهدف إلى تعزيز فهم سلوك الأنظمة الجزيئية على المستوى الذري من خلال المعرفة عبر المجالات، وتحقيق محاكاة ديناميكية فعّالة طويلة المدى. تُظهر النتائج التجريبية أن UniSim قد أظهر أداءً تنافسيًا للغاية في مجالات مُتعددة، مثل الجزيئات الصغيرة، وسلاسل الببتيد، والبروتينات، وخاصةً في قدرات تعلم النقل ومحاكاة الديناميكيات طويلة المدى.

رابط الورقة:https://go.hyper.ai/0Eqsu

مخطط معماري للنموذج
خريطة ذهنية ورقية

هذا هو كل محتوى توصيات البحث لهذا الأسبوع. لمزيد من أبحاث الذكاء الاصطناعي المتطورة، يُرجى زيارة hyper.ai "أحدث ورقة بحثية"طبق.

نرحب أيضًا بفرق البحث لتقديم نتائج وأوراق بحثية عالية الجودة إلينا. يمكن للمهتمين إضافة حساب نيوروستار على وي تشات (معرف وي تشات: Hyperai01).

نراكم في الاسبوع القادم!