HyperAIHyperAI

Command Palette

Search for a command to run...

Ein Repository von Konversationsdatensätzen

Matthew Henderson; Paweł Budzianowski; Iñigo Casanueva; Sam Coope; Daniela Gerz; Girish Kumar; Nikola Mrkšić; Georgios Spithourakis; Pei-Hao Su; Ivan Vulić; Tsung-Hsien Wen

Zusammenfassung

Fortschritte im maschinellen Lernen werden häufig durch die Verfügbarkeit großer Datensätze und konsistente Bewertungsmaßstäbe für den Vergleich von Modellierungsansätzen getrieben. In diesem Kontext präsentieren wir ein Repository von konversationsbasierten Datensätzen, das aus Hunderten von Millionen von Beispielen besteht, sowie ein standardisiertes Evaluationsverfahren für Modelle zur Auswahl konversationeller Antworten unter Verwendung der „1-von-100-Akurzität“ (1-of-100 accuracy). Das Repository enthält Skripte, die es Forschern ermöglichen, die Standarddatensätze zu reproduzieren oder die Vorverarbeitungsschritte und Datenfilterungen ihren Bedürfnissen anzupassen. Wir stellen und bewerten mehrere wettbewerbsfähige Baseline-Modelle für die Auswahl konversationeller Antworten vor, deren Implementierungen im Repository freigegeben werden, sowie ein neuronales Encoder-Modell, das auf dem gesamten Trainingsdatensatz trainiert wurde.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Ein Repository von Konversationsdatensätzen | Paper | HyperAI