HyperAIHyperAI

Command Palette

Search for a command to run...

Die Robustheit von Retrieval-augmentierten Sprachmodellen gegenüber irrelevantem Kontext verbessern

Ori Yoran Tomer Wolfson Ori Ram Jonathan Berant

Zusammenfassung

Retrieval-augmented language models (RALMs) versprechen die Entwicklung von Sprachverstehenssystemen, die faktisch, effizient und aktuell sind. Ein wesentlicher Anspruch an RALMs ist, dass abgerufene Informationen die Modellleistung verbessern, wenn sie relevant sind, und die Leistung nicht beeinträchtigen, wenn sie irrelevant sind. Dies ist besonders in Szenarien mit mehrstufiger Schlussfolgerung (multi-hop reasoning) von Bedeutung, da die falsche Nutzung irrelevanter Hinweise zu kaskadenartigen Fehlern führen kann. Allerdings hat jüngste Forschung gezeigt, dass die Retrieval-Augmentation die Leistung manchmal sogar negativ beeinflussen kann. In dieser Arbeit präsentieren wir eine umfassende Analyse an fünf Benchmarks für offene Domänen-Fragebeantwortung, um die Fälle zu charakterisieren, in denen das Retrieval die Genauigkeit verringert. Anschließend schlagen wir zwei Methoden zur Milderung dieses Problems vor. Erstens ein einfacher Baseline-Ansatz, der abgerufene Textpassagen filtert, die gemäß einem Natural Language Inference (NLI)-Modell keine Implikationen für die Frage-Antwort-Paare enthalten. Dieser Ansatz ist wirksam, um eine Leistungseinbuße zu verhindern, hat jedoch den Nachteil, dass auch relevante Passagen verworfen werden. Daher schlagen wir eine Methode vor, um automatisch Trainingsdaten zu generieren, um das Sprachmodell darauf zu feinabstimmen, abgerufene Informationen angemessen zu nutzen, indem wir während des Trainings eine Mischung aus relevanten und irrelevanten Kontexten verwenden. Wir zeigen empirisch, dass bereits 1.000 solcher Beispiele ausreichen, um das Modell robust gegenüber irrelevanten Kontexten zu machen, während gleichzeitig eine hohe Leistung bei Beispielen mit relevanten Kontexten erhalten bleibt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Die Robustheit von Retrieval-augmentierten Sprachmodellen gegenüber irrelevantem Kontext verbessern | Paper | HyperAI