HyperAIHyperAI

Command Palette

Search for a command to run...

Proxy-Metriken für die Qualität von Open-Domain-Dialogen

Ricardo Usbeck Jens Lehmann Rostislav Nedelchev

Zusammenfassung

Die automatische Bewertung offener Domänen-Dialoge bleibt eine weitgehend ungelöste Herausforderung. Trotz der großen Menge an Forschungsarbeiten in diesem Bereich müssen Dialogqualitäten weiterhin von menschlichen Beurteilern bewertet werden. Folglich ist eine solche Bewertung im großen Maßstab meist kostspielig. In dieser Arbeit wird untersucht, ob ein tiefes Lernmodell, das auf dem General Language Understanding Evaluation (GLUE)-Benchmark trainiert wurde, als Indikator für die Qualität offener Domänen-Dialoge dienen kann. Ziel ist es, die verschiedenen GLUE-Aufgaben als unterschiedliche Perspektiven zur Beurteilung der Dialogqualität zu nutzen, wodurch der Bedarf an zusätzlichen Trainingsdaten oder Antwortbeispielen als Qualitätsreferenzen reduziert wird. Aufgrund dieser Eigenschaft ist das Verfahren in der Lage, verschiedene Qualitätsmetriken abzuleiten und einen komponentenbasierten Gesamtwert zu ermitteln. Wir erreichen statistisch signifikante Korrelationskoeffizienten von bis zu 0,7.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Proxy-Metriken für die Qualität von Open-Domain-Dialogen | Paper | HyperAI