بيوميد جي بي تي: نموذج أساسي متعدد المهام للرؤية واللغة في المجالات الطبية الحيوية المتنوعة

النماذج التقليدية للذكاء الاصطناعي في مجال الطب الحيوي، المصممة لأداء مهام أو أنواع بيانات محددة، غالبًا ما تُظهر مرونة محدودة في التطبيقات الواقعية وتشتكي من صعوبة استغلال المعلومات الشاملة. يمتلك الذكاء الاصطناعي العام إمكانات لمعالجة هذه القيود بفضل مرونته في تفسير أنواع مختلفة من البيانات وإنتاج إخراجات مخصصة تلبي احتياجات متنوعة. ومع ذلك، فإن الحلول الحالية للذكاء الاصطناعي العام في المجال الطبي الحيوي تكون غالبًا ثقيلة جدًا ومغلقة المصدر بالنسبة للباحثين والممارسين والمرضى. هنا، نقترح BiomedGPT، أول نموذج أساسي بصري-لغوي خفيف الوزن ومفتوح المصدر، مصمم كنموذج عام قادر على أداء مجموعة متنوعة من المهام الطبية الحيوية. حقق BiomedGPT أداءً متقدمًا على مستوى الحد الأقصى (state-of-the-art) في 16 من أصل 25 تجربة، مع الحفاظ على حجم نموذج متوافق مع موارد الحوسبة. كما أجرينا تقييمات بشرية لتقييم قدرات BiomedGPT في إجابة الأسئلة البصرية في مجال التصوير الإشعاعي، وإعداد التقارير، والتلخيص. أظهر BiomedGPT قدرة تنبؤية قوية مع معدل خطأ منخفض بلغ 3.8% في إجابة الأسئلة، وأداءً مرضيًا بخطأ بلغ 8.3% في كتابة تقارير تصوير إشعاعي معقدة، ومهارات تلخيص تنافسية مع درجة تفضيل قريبة جدًا من تلك التي يحققها الخبراء البشريون. تُظهر نهجنا أن التدريب الفعّال باستخدام بيانات متنوعة يمكن أن يؤدي إلى تطوير ذكاء اصطناعي طبي حيوي أكثر عملية، مما يسهم في تحسين دقة التشخيص وفعالية سير العمل.