Command Palette
Search for a command to run...
مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench
مجموعة بيانات chi-bench (معيار الذكاء السريري للرعاية الصحية) هي مجموعة بيانات لتقييم وكلاء الذكاء في مجال الرعاية الصحية، وقد أصدرتها شركة Actava AI في عام 2026. وتشمل الأبحاث ذات الصلة ما يلي... CHI-Bench: هل يمكن لوكلاء الذكاء الاصطناعي أتمتة سير العمل في مجال الرعاية الصحية من البداية إلى النهاية، وعلى المدى الطويل، والغني بالسياسات؟ تهدف مجموعة البيانات هذه إلى تقييم قدرات وكيل الذكاء الاصطناعي في التخطيط والاستدلال واستدعاء الأدوات والتعاون بين الأنظمة في سير عمل الرعاية الصحية الأمريكية من البداية إلى النهاية. تُنشئ هذه المجموعة من البيانات بيئة محاكاة عالية الدقة للأعمال الطبية، حيث تدمج 20 نظامًا للتطبيقات الطبية عبر واجهة MCP (بروتوكول سياق النموذج) المفتوحة، وتوفر قاعدة معرفية تضم 1279 وثيقة لعمليات طبية. تغطي سيناريوهات التقييم ثلاثة مجالات رئيسية في نظام الرعاية الصحية الأمريكي: الموافقة المسبقة، وإدارة الاستشهادات، وإدارة رعاية السكان. تتضمن المجموعة 101 مهمة تقييم، منها 75 مهمة أساسية، و23 مهمة شاملة ثنائية العوامل، و3 مهام ماراثونية طويلة المدى. يمكن استخدامها في البحث والتقييم في مجالات مثل النماذج الطبية واسعة النطاق، والوكلاء الطبيين، والتعاون متعدد العوامل، وأتمتة العمليات الطبية.
الاستشهاد
@misc{chen2026chibenchaiagentsautomate,
title={CHI-Bench: Can AI Agents Automate End-to-End, Long-Horizon, Policy-Rich Healthcare Workflows?},
author={Haolin Chen and Deon Metelski and Leon Qi and Tao Xia and Joonyul Lee and Steve Brown and Kevin Riley and Frank Wang and T. Y. Alvin Liu and Hank Capps MD and Zeyu Tang and Xiangchen Song and Lingjing Kong and Fan Feng and Tianyi Zeng and Zhiwei Liu and Zixian Ma and Hang Jiang and Fangli Geng and Yuan Yuan and Chenyu You and Qingsong Wen and Hua Wei and Yanjie Fu and Yue Zhao and Carl Yang and Biwei Huang and Kun Zhang and Caiming Xiong and Sanmi Koyejo and Eric P. Xing and Philip S. Yu and Weiran Yao},
year={2026},
eprint={2605.16679},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2605.16679},
}
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.