HyperAIHyperAI

Command Palette

Search for a command to run...

USR: Ein unsupervisionierter und referenzfreier Bewertungsmaßstab für Dialoggenerierung

Shikib Mehri Maxine Eskenazi

Zusammenfassung

Der Mangel an sinnvollen automatisierten Bewertungsmetriken für Dialoge hat die Forschung im Bereich offener Domänen-Dialoge erheblich beeinträchtigt. Standard-Metriken zur Sprachgenerierung haben sich als unwirksam für die Bewertung von Dialogmodellen erwiesen. Um diesem Problem entgegenzuwirken, präsentiert dieser Artikel USR – eine unsupervisierte und referenzfreie Bewertungsmetrik für Dialoge. USR ist eine referenzfreie Metrik, die unsupervisierte Modelle nutzt, um mehrere wünschenswerte Eigenschaften von Dialogen zu messen. Es wird gezeigt, dass USR eine starke Korrelation mit menschlichen Beurteilungen auf beiden Datensätzen Topical-Chat (turn-basiert: 0,42, system-basiert: 1,0) und PersonaChat (turn-basiert: 0,48, system-basiert: 1,0) aufweist. Zudem liefert USR interpretierbare Maße für mehrere wünschenswerte Eigenschaften von Dialogen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
USR: Ein unsupervisionierter und referenzfreier Bewertungsmaßstab für Dialoggenerierung | Paper | HyperAI