HyperAIHyperAI

Command Palette

Search for a command to run...

BioMegatron: Ein größerer Sprachmodell für den biomedizinischen Bereich

Hoo-Chang Shin Yang Zhang Evelina Bakhturina Raul Puri Mostofa Patwary Mohammad Shoeybi Raghav Mani

Zusammenfassung

Es hat einen starken Zuwachs an domain-spezifischen Sprachmodellen für den biomedizinischen Bereich gegeben, wobei sich gezeigt hat, dass Sprachmodelle, die auf biomedizinischem Text vortrainiert wurden, auf biomedizinischen Benchmark-Aufgaben besser abschneiden als solche, die auf allgemeinen Textkorpora wie Wikipedia oder Büchern trainiert wurden. Dennoch untersuchen die meisten Arbeiten die Faktoren, die die Leistung in spezifischen Domänenanwendungen beeinflussen, nur oberflächlich. Zudem fehlt eine umfassende Analyse des Einflusses der Modellgröße auf domain-spezifische Modelle weitgehend. In dieser Arbeit untersuchen und bewerten wir empirisch mehrere Faktoren, die die Leistung biomedizinischer Sprachanwendungen beeinflussen können, darunter das Subwort-Vokabular, die Modellgröße, das Vortrainingskorpus und der Domänen-Transfer. Wir zeigen konsistente Verbesserungen auf Benchmarks mit unserem größeren BioMegatron-Modell, das auf einem umfangreicheren Domänenkorpus trainiert wurde, was unser Verständnis für die Anwendung von Domänen-Sprachmodellen erweitert. Unsere Ergebnisse demonstrieren deutliche Fortschritte gegenüber dem vorherigen Stand der Technik (SOTA) auf etablierten biomedizinischen NLP-Benchmarks für Named Entity Recognition, Relationsextraktion und Fragebeantwortung. Die Modell-Checkpoints und der Quellcode sind unter [https://ngc.nvidia.com] und [https://github.com/NVIDIA/NeMo] verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp