HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

BioELECTRA : encodeur préentraîné pour textes biomédicaux utilisant des discriminateurs

{Malaikannan Sankarasubbu Bhuvana Kundumani Kamal raj Kanakarajan}

BioELECTRA : encodeur préentraîné pour textes biomédicaux utilisant des discriminateurs

Résumé

Les avancées récentes dans les stratégies de pré-entraînement en traitement du langage naturel (NLP) ont permis une amélioration significative des performances des modèles sur diverses tâches d’extraction de connaissances textuelles. Nous appliquons la technique de pré-entraînement « replaced token detection » proposée par ELECTRA, et entraînons un modèle linguistique biomédical à partir de zéro à l’aide de textes biomédicaux et d’un vocabulaire spécifiques. Nous introduisons BioELECTRA, un modèle d’encodeur linguistique spécialisé dans le domaine biomédical, adapté à partir d’ELECTRA. Nous évaluons notre modèle sur les benchmarks NLP biomédicaux BLURB et BLUE. BioELECTRA surpasser les modèles précédents et atteint l’état de l’art (SOTA) sur l’ensemble des 13 jeux de données du benchmark BLURB ainsi que sur les 4 jeux de données cliniques du benchmark BLUE, couvrant 7 tâches différentes de NLP. BioELECTRA, pré-entraîné sur les articles complets de PubMed et PMC, se distingue également fortement sur les jeux de données cliniques. Le modèle atteint un nouveau SOTA de 86,34 % (amélioration de 1,39 % en précision) sur le jeu de données MedNLI, et de 64 % (amélioration de 2,98 % en précision) sur PubMedQA.

Benchmarks

BenchmarkMéthodologieMétriques
medical-named-entity-recognition-on-shareBioELECTRA
F1: 0.8371
natural-language-inference-on-mednliBioELECTRA-Base
Accuracy: 86.34
Params (M): 110
question-answering-on-pubmedqaBioELECTRA uncased
Accuracy: 64.2

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp