HyperAIHyperAI

Command Palette

Search for a command to run...

Kernellösung ohne Spannendarstellungen

Yuval Kirstain Ori Ram Omer Levy

Zusammenfassung

Die Einführung vortrainierter Sprachmodelle hat viele komplexe, auf spezifische Aufgaben zugeschnittene NLP-Modelle auf einfache, leichtgewichtige Schichten reduziert. Eine Ausnahme von diesem Trend ist die Coreferenzauflösung, bei der ein anspruchsvolles, auf die Aufgabe zugeschnittenes Modell an einen vortrainierten Transformer-Encoder angehängt wird. Obwohl dieses Modell äußerst wirksam ist, weist es einen sehr großen Speicherbedarf auf – vor allem aufgrund dynamisch erstellter Span- und Span-Paar-Repräsentationen –, was die Verarbeitung kompletter Dokumente sowie die gleichzeitige Training auf mehreren Instanzen in einem Batch erschwert. Wir stellen ein leichtgewichtiges, end-to-end-Modell für die Coreferenzauflösung vor, das auf Span-Repräsentationen, handgefertigte Merkmale und Heuristiken verzichtet. Unser Modell erreicht eine Wettbewerbsfähigkeit mit dem derzeitigen Standardmodell, ist jedoch einfacher und effizienter.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp