SOLOIST: Skalierbares Erstellen von Task-Bots mit Transfer Learning und Maschinellem Lehren

Wir stellen eine neue Methode namens SOLOIST vor, die Transfer Learning und maschinelles Unterrichten verwendet, um Task-Bots in großem Maßstab zu erstellen. Wir parametrisieren klassische modulare taskorientierte Dialogsysteme mit einem auf Transformer basierenden autoregressiven Sprachmodell, das verschiedene Dialogmodule in ein einziges neuronales Modell integriert. Wir führen eine Vortrainierung auf heterogenen Dialogkorpora durch, um ein taskbasiertes Antwortgenerierungsmodell zu erstellen, das Dialogantworten generieren kann, die auf Benutzerziele und reale Weltwissen für die Taskabwicklung gestützt sind. Das vortrainierte Modell kann effizient angepasst werden, um neue Aufgaben mit wenigen taskspezifischen Dialogen durch maschinelles Unterrichten zu bewältigen, wobei Trainingsbeispiele durch menschliche Lehrer, die mit dem System interagieren, erzeugt werden. Experimente zeigen, dass (i) SOLOIST neue Standarts auf gut untersuchten taskorientierten Dialogbenchmarks wie CamRest676 und MultiWOZ schafft; (ii) in Few-Shot-Fine-Tuning-Szenarien SOLOIST bestehende Methoden deutlich übertrifft und (iii) das maschinelle Unterrichten den Etikettierungsaufwand des Fine-Tunings erheblich reduziert. Die vortrainierten Modelle und Codes sind unter https://aka.ms/soloist verfügbar.