Mehrsprachiger Medizinischer Datensatz Von ApolloCorpora
Datum
Größe
Veröffentlichungs-URL
Kategorien
ApolloCorpora ist ein mehrsprachiger medizinischer Datensatz, der gemeinsam vom Shenzhen Big Data Research Institute und dem Forschungsteam der Chinesischen Universität Hongkong erstellt wurde. Der Datensatz umfasst sechs Hauptsprachen, die von 6,1 Milliarden Menschen weltweit gesprochen werden, darunter Englisch, Chinesisch, Hindi, Spanisch, Französisch und Arabisch.
Die Datenerfassung umfasste Bücher, klinische Richtlinien, Enzyklopädien, Artikel, Foren und Prüfungen. In Bezug auf die Datenverarbeitung wandelten die Forscher das ursprüngliche Vortrainingskorpus in Frage-Antwort-Paare um, um die medizinischen Fähigkeiten des Modells zu verbessern. ApolloCorpora konzentriert sich außerdem auf lokalisierte Funktionen wie Symptomdiagnose, Medikamentennamen, Kommunikationsterminologie und medizinische Praxisstandards, um sich an unterschiedliche Kulturen und medizinische Systeme anzupassen. Dieser Datensatz bietet eine solide Grundlage für die Entwicklung und Bewertung mehrsprachiger medizinischer KI-Modelle und trägt dazu bei, die weltweite Anwendung medizinischer KI-Technologie zu fördern.