HyperAIHyperAI

Command Palette

Search for a command to run...

LlamBERT: Großskalige kostengünstige Datenannotation in der NLP

Bálint Csanády Lajos Muzsai Péter Vedres Zoltán Nádasdy András Lukács

Zusammenfassung

Große Sprachmodelle (LLMs), wie GPT-4 und Llama 2, zeigen beachtliche Leistungsfähigkeit bei einer Vielzahl von Aufgaben im Bereich des natürlichen Sprachverstehens (Natural Language Processing, NLP). Trotz ihrer Effektivität stellen die hohen Kosten, die mit ihrer Nutzung verbunden sind, eine Herausforderung dar. Wir stellen LlamBERT vor, einen hybriden Ansatz, der LLMs nutzt, um eine kleine Teilmenge großer, unbeschrifteter Datensätze zu annotieren, und die Ergebnisse anschließend zur Feinabstimmung von Transformer-Encodern wie BERT und RoBERTa heranzieht. Diese Strategie wird an zwei unterschiedlichen Datensätzen evaluiert: dem IMDb-Review-Datensatz und dem UMLS Meta-Thesaurus. Unsere Ergebnisse zeigen, dass der LlamBERT-Ansatz zwar eine geringfügige Reduktion der Genauigkeit aufweist, jedoch eine erheblich bessere Kosten-Nutzen-Relation bietet.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp