HyperAIHyperAI
منذ 17 أيام

قدرات نماذج جيميني في الطب

Khaled Saab, Tao Tu, Wei-Hung Weng, Ryutaro Tanno, David Stutz, Ellery Wulczyn, Fan Zhang, Tim Strother, Chunjong Park, Elahe Vedadi, Juanma Zambrano Chaves, Szu-Yeu Hu, Mike Schaekermann, Aishwarya Kamath, Yong Cheng, David G. T. Barrett, Cathy Cheung, Basil Mustafa, Anil Palepu, Daniel McDuff, Le Hou, Tomer Golany, Luyang Liu, Jean-baptiste Alayrac, Neil Houlsby, Nenad Tomasev, Jan Freyberg, Charles Lau, Jonas Kemp, Jeremy Lai, Shekoofeh Azizi, Kimberly Kanada, SiWai Man, Kavita Kulkarni, Ruoxi Sun, Siamak Shakeri, Luheng He, Ben Caine, Albert Webson, Natasha Latysheva, Melvin Johnson, Philip Mansfield, Jian Lu, Ehud Rivlin, Jesper Anderson, Bradley Green, Renee Wong, Jonathan Krause, Jonathon Shlens, Ewa Dominowska, S. M. Ali Eslami, Claire Cui, Oriol Vinyals, Koray Kavukcuoglu, James Manyika, Jeff Dean, Demis Hassabis, Yossi Matias, Dale Webster, Joelle Barral, Greg Corrado, Christopher Semturs, S. Sara Mahdavi, Juraj Gottweis, Alan Karthikesalingam, Vivek Natarajan
قدرات نماذج جيميني في الطب
الملخص

تمثّل التميز في مجموعة واسعة من التطبيقات الطبية تحديات كبيرة أمام الذكاء الاصطناعي، مما يتطلب تفكيرًا متقدمًا، والوصول إلى معرفة طبية محدثة، وفهمًا عميقًا للبيانات متعددة الوسائط المعقدة. تقدم نماذج جيميني، التي تمتلك قدرات عامة قوية في التفكير متعدد الوسائط والتحليل طويل السياق، إمكانيات واعدة جدًا في المجال الطبي. بالاعتماد على هذه القواعد الأساسية لنموذج جيميني، نقدّم Med-Gemini، وهي عائلة من النماذج متعددة الوسائط ذات كفاءة عالية ومُخصّصة للطب، وتتمتع بقدرة على استخدام البحث عبر الويب بشكل سلس، ويمكن تكييفها بكفاءة لتقنيات جديدة باستخدام مشغلات مخصصة. قمنا بتقييم Med-Gemini على 14 معيارًا طبيًا، وأثبتت نتائجها تفوّقًا على الحد الأقصى الحالي (SoTA) في 10 منها، وتفوّقت على عائلة نماذج GPT-4 في كل معيار يمكن مقارنتها مباشرة معه، غالبًا بفارق كبير. وعلى معيار MedQA (USMLE) الشهير، حقق أفضل نموذج في عائلة Med-Gemini أداءً متميزًا بـ 91.1% من الدقة، باستخدام استراتيجية بحث موجهة بالشكوك، وهي جديدة تمامًا. وعلى 7 معايير متعددة الوسائط، بما في ذلك تحديات الصور من مجلة NEJM وMMMU (الصحة والطب)، تفوقت Med-Gemini على GPT-4V بمتوسط نسبي قدره 44.5%. ونُظهر فعالية قدرات Med-Gemini في التعامل مع السياقات الطويلة من خلال أداء متميز في مهمة استرجاع "الإبرة في كومة قش" من سجلات صحية طويلة غير مُعرّفة، وفي إجابة أسئلة الفيديو الطبي، متفوقةً على الطرق المخصصة السابقة التي تعتمد فقط على التعلم ضمن السياق. وأخيرًا، يشير أداء Med-Gemini إلى جدواها العملية الحقيقية، حيث تفوقت خبراء بشريين في مهام مثل تلخيص النصوص الطبية، إلى جانب إظهار إمكانات واعدة في مجالات الحوار الطبي متعدد الوسائط، والبحث الطبي، والتعليم الطبي. جماعيًا، تقدّم نتائجنا أدلة مقنعة على الإمكانات الكامنة في Med-Gemini، ومع ذلك، فإن التقييم الدقيق والمكثف سيكون أمرًا حاسمًا قبل تطبيقها في البيئات الحقيقية في هذا المجال الحيوي الذي يرتبط بأمان حياة البشر.

قدرات نماذج جيميني في الطب | أحدث الأوراق البحثية | HyperAI