HyperAIHyperAI

Command Palette

Search for a command to run...

Ein hierarchischer Mehrfachaufgabenansatz für das Lernen von Einbettungen aus semantischen Aufgaben

Victor Sanh Thomas Wolf Sebastian Ruder

Zusammenfassung

Viel Mühe wurde darauf verwendet, zu evaluieren, ob das Multi-Task-Lernen genutzt werden kann, um reichhaltige Darstellungen zu erlernen, die in verschiedenen Anwendungen der Natürlichen Sprachverarbeitung (NLP) eingesetzt werden können. Allerdings fehlt es noch an einem tieferen Verständnis der Szenarien, in denen das Multi-Task-Lernen einen signifikanten Effekt hat. In dieser Arbeit stellen wir ein hierarchisches Modell vor, das in einer Multi-Task-Lernkonfiguration auf einer Reihe sorgfältig ausgewählter semantischer Aufgaben trainiert wird. Das Modell wird hierarchisch trainiert, um durch die Überwachung von niedrigstufigen Aufgaben in den unteren Schichten und komplexeren Aufgaben in den oberen Schichten des Modells einen induktiven Bias einzuführen. Dieses Modell erzielt Stand-of-the-Art-Ergebnisse bei mehreren Aufgaben, nämlich der Namensentitätserkennung (Named Entity Recognition), der Entitätsnennungserkennung (Entity Mention Detection) und der Relationsextraktion, ohne handgefertigte Merkmale oder externe NLP-Werkzeuge wie syntaktische Parser zu verwenden. Die hierarchische Trainingsüberwachung induziert eine Reihe gemeinsamer semantischer Darstellungen in den unteren Schichten des Modells. Wir zeigen, dass die verborgenen Zustände der Schichten sich von den unteren zu den oberen Schichten hin zunehmend komplexerer semantischer Information annähern.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp