HyperAIHyperAI

Command Palette

Search for a command to run...

KERMIT: Generatives einsetzungsbasierendes Modellierung für Sequenzen

William Chan; Nikita Kitaev; Kelvin Guu; Mitchell Stern; Jakob Uszkoreit

Zusammenfassung

Wir stellen KERMIT vor, einen einfachen einfügungsbasierten Ansatz für die generative Modellierung von Sequenzen und Sequenzpaaren. KERMIT modelliert die gemeinsame Verteilung und ihre Zerlegungen (d.h., Randverteilungen und bedingte Verteilungen) mithilfe eines einzigen neuronalen Netzes und unterscheidet sich im Gegensatz zu vielen früheren Arbeiten dadurch, dass es nicht auf eine vorgegebene Faktorisierung der Datenverteilung angewiesen ist. Während des Trainings kann man KERMIT gepaarte Daten (x,y)(x, y)(x,y) zur Lernung der gemeinsamen Verteilung p(x,y)p(x, y)p(x,y) zuführen und optional unangepaarte Daten xxx oder yyy hinzufügen, um die Randverteilungen p(x)p(x)p(x) oder p(y)p(y)p(y) zu verfeinern. Während der Inferenz haben wir Zugang zu den bedingten Verteilungen p(xy)p(x \mid y)p(xy) und p(yx)p(y \mid x)p(yx) in beiden Richtungen. Wir können auch aus der gemeinsamen Verteilung oder den Randverteilungen sampeln. Das Modell unterstützt sowohl serielle vollständig autoregressive Dekodierung als auch parallele teilweise autoregressive Dekodierung, wobei letztere empirisch logarithmische Laufzeiten aufweist. Durch Experimente im maschinellen Übersetzen, Repräsentationslernen und bei Zero-Shot-Cloze-Fragen beantworten zeigen wir, dass unser einheitlicher Ansatz in der Lage ist, die Leistung spezialisierter state-of-the-art-Systeme über einen breiten Spektrum von Aufgaben hinweg zu erreichen oder sogar zu übertreffen, ohne eine problemabhängige architekturale Anpassung zu erfordern.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
KERMIT: Generatives einsetzungsbasierendes Modellierung für Sequenzen | Paper | HyperAI