HyperAIHyperAI

Command Palette

Search for a command to run...

ReasonMed: مجموعة بيانات متعددة الوكلاء بحجم 370K لتطوير الاستدلال الطبي

Yu Sun Xingyu Qian Weiwen Xu Hao Zhang Chenghao Xiao Long Li Yu Rong Wenbing Huang Qifeng Bai Tingyang Xu

الملخص

رغم أن نماذج اللغات الكبيرة القائمة على الاستدلال (LLMs) قد أظهرت تفوقًا في الرياضيات والبرمجة، فإن قدراتها في الإجابة على الأسئلة الطبية المكثفة بالمعرفة لا تزال قليلة الدراسة. لمعالجة هذا، نقدم ReasonMed، وهو أكبر مجموعة بيانات للاستدلال الطبي، والتي تتكون من 370 ألف مثال عالي الجودة تم استخلاصها من 1.7 مليون مسار استدلال أولي تم إنشاؤه بواسطة نماذج اللغات الكبيرة المختلفة. يتم بناء ReasonMed من خلال عملية التحقق والتكرار متعددة الوكلاء، حيث نصمم مصححًا للأخطاء (Error Refiner) لتعزيز المسارات الاستدلالية من خلال تحديد وتصحيح الخطوات المعرضة للأخطاء التي يشير إليها مدقق (verifier). باستغلال ReasonMed، نقوم بدراسة منهجية لأفضل الممارسات لتدريب نماذج الاستدلال الطبي ونجد أن الجمع بين الاستدلال التفصيلي سلسلة الفكر (Chain-of-Thought - CoT) والإجابات الملخصة بشكل دقيق يعد استراتيجية التعديل الدقيق الأكثر فعالية. بناءً على هذه الاستراتيجية، قمنا بتدريب ReasonMed-7B، والذي يحدد معيارًا جديدًا للنماذج ذات الحجم أقل من 10 مليار معلمة، حيث يتفوق بنسبة 4.17٪ على أفضل النماذج السابقة ويتجاوز حتى LLaMA3.1-70B فيPubMedQA بنسبة 4.60٪.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp