مجموعة بيانات ApolloCorpora الطبية متعددة اللغات
التاريخ
الحجم
رابط النشر
ApolloCorpora هي مجموعة بيانات طبية متعددة اللغات تم إنشاؤها بشكل مشترك من قبل معهد أبحاث البيانات الضخمة في شنتشن وفريق البحث في جامعة هونج كونج الصينية. وتغطي مجموعة البيانات ست لغات رئيسية يتحدث بها 6.1 مليار شخص حول العالم، بما في ذلك الإنجليزية والصينية والهندية والإسبانية والفرنسية والعربية.
وتضمن جمع البيانات الكتب والمبادئ التوجيهية السريرية والموسوعات والأوراق والمنتديات والاختبارات. ومن حيث معالجة البيانات، قام الباحثون بتحويل مجموعة البيانات الأصلية قبل التدريب إلى أزواج من الأسئلة والأجوبة لتعزيز القدرات الطبية للنموذج. وتركز ApolloCorpora أيضًا على الميزات المحلية مثل تشخيص الأعراض وأسماء الأدوية ومصطلحات الاتصال ومعايير الممارسة الطبية للتكيف مع الثقافات والأنظمة الطبية المختلفة. توفر مجموعة البيانات هذه أساسًا متينًا لتطوير وتقييم نماذج الذكاء الاصطناعي الطبي متعدد اللغات، وتساعد في تعزيز التطبيق العالمي لتكنولوجيا الذكاء الاصطناعي الطبي.