HyperAIHyperAI

Command Palette

Search for a command to run...

CBLUE: Eine Bewertungs基准 für das Verständnis von chinesischen biomedizinischen Sprachmodellen 请注意,"基准"在德语中通常翻译为"Benchmark",因此更准确的翻译应该是: CBLUE: Eine Bewertungsbenchmark für das Verständnis von chinesischen biomedizinischen Sprachmodellen

Zusammenfassung

Künstliche Intelligenz (KI) und die jüngsten Fortschritte im Bereich der biomedizinischen Sprachverarbeitung verändern allmählich die medizinische Praxis. Mit der Entwicklung von Benchmarks für die biomedizinische Sprachverarbeitung werden KI-Anwendungen im medizinischen Bereich zunehmend eingesetzt. Dennoch sind die meisten Benchmarks auf Englisch begrenzt, was es schwierig macht, viele der Erfolge in Englisch für andere Sprachen zu replizieren. Um die Forschung in diese Richtung zu fördern, sammeln wir realweltliche biomedizinische Daten und präsentieren den ersten chinesischen Benchmark für die biomedizinische Sprachverarbeitung (CBLUE): eine Sammlung von natürlichsprachlichen Verständnisaufgaben, darunter Named Entity Recognition (NER), Informationsextraktion, klinische Diagnosennormalisierung, Einzelsatz-/Satzpaar-Klassifikation sowie eine zugehörige Online-Plattform zur Modellbewertung, -vergleich und -analyse. Um die Bewertung dieser Aufgaben zu etablieren, berichten wir empirische Ergebnisse mit den momentan 11 vortrainierten chinesischen Modellen. Die experimentellen Ergebnisse zeigen, dass selbst die besten neuronalen Modelle weitaus schlechter als das menschliche Leistungsniveau abschneiden. Unser Benchmark ist unter \url{https://tianchi.aliyun.com/dataset/dataDetail?dataId=95414&lang=en-us} veröffentlicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
CBLUE: Eine Bewertungs基准 für das Verständnis von chinesischen biomedizinischen Sprachmodellen 请注意,"基准"在德语中通常翻译为"Benchmark",因此更准确的翻译应该是: CBLUE: Eine Bewertungsbenchmark für das Verständnis von chinesischen biomedizinischen Sprachmodellen | Paper | HyperAI