Kontextuelle Einbettung und Modellgewichtung durch Fusion von Domänenwissen in der Biomedizinischen Fragebeantwortung

Biomedizinische Fragebeantwortung (Biomedical Question Answering) strebt danach, eine Antwort auf eine gegebene Frage aus dem biomedizinischen Bereich zu erhalten. Aufgrund der hohen Anforderungen an das Wissen im biomedizinischen Bereich ist es für das Modell schwierig, dieses Wissen aus begrenzten Trainingsdaten zu lernen. Wir schlagen eine kontextuelle Einbettungsmethode vor, die ein offenes QA-Modell (\aoa) und das \biobert-Modell, das auf biomedizinischen Daten vortrainiert wurde, kombiniert. Wir verwenden unsupervisiertes Vortraining auf einem großen biomedizinischen Korpus und supervisiertes Feinjustierungstraining auf einem biomedizinischen Fragebeantwortungsdatensatz. Zudem integrieren wir eine Gewichtungsschicht basierend auf einem mehrschichtigen Perzeptron (MLP), um die Vorteile beider Modelle automatisch auszunutzen und die korrekte Antwort zu liefern. Das öffentliche Datensatz \biomrc, der aus dem PubMed-Korpus konstruiert wurde, wird verwendet, um unsere Methode zu evaluieren. Die experimentellen Ergebnisse zeigen, dass unser Modell den aktuellen Stand der Technik (state-of-the-art system) deutlich übertrifft.