vor 2 Monaten

Zusammenfassung

Schnelle und hochwertige Sprachgenerierung ist das heilige Gralziel, das Menschen im Zeitalter der Künstlichen Intelligenz verfolgen. In dieser Arbeit stellen wir DiDi-Instruct (Discrete Diffusion Divergence Instruct) vor, eine auf Training basierende Methode, die von einem vortrainierten (maskierten) diskreten Diffusions-Sprachmodell (dLLM) ausgeht und ein mehrschrittiges Studentenmodell zur schnellen Generierung durch Distanzierung erzeugt. Das resultierende DiDi-Instruct-Modell erreicht eine Leistung, die der seines dLLM-Lehrers oder der des GPT-2-Baselines vergleichbar ist oder diese übertrifft, während es eine Beschleunigung von bis zu 64 ermöglicht. Die theoretische Grundlage von DiDi-Instruct ist ein neuartiges Framework, das auf der Minimierung der integralen KL-Divergenz basiert und ein praktikables Trainingsverfahren liefert. Zudem führen wir gruppierte Belohnungsnormierung, Matching der Zwischenzustände und den belohnungsgeleiteten abgeleiteten Sampler ein, die die Trainingsstabilität, die Modellabdeckung und die Inferenzqualität erheblich verbessern. Auf dem OpenWebText-Datensatz erzielt DiDi-Instruct eine Perplexität von 62,2 (8 NFEs) bis hin zu 18,4 (128 NFEs), was die Leistung vorheriger beschleunigter dLLMs und die des GPT-2-Baselines übertrifft. Diese Verbesserungen gehen mit einer vernachlässigbaren Entropieverlust (etwa ) einher und reduzieren die zusätzliche Trainingsdauer um mehr als gegenüber konkurrierenden Distanzierungsmethoden für dLLMs. Wir validieren die Robustheit und Effektivität von DiDi-Instruct zudem durch umfassende Ablationstudien, Modellvergrößerung sowie die Generierung diskreter Proteinsequenzen. Zusammenfassend ist DiDi-Instruct eine effiziente und dennoch leistungsfähige Distanzierungsmethode, die die Sprachgenerierung im Nu ermöglicht.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 2 Monaten

Natürliche Sprachverarbeitung

Aufgabe

Haoyang Zheng Xinyang Liu Cindy Xiangrui Kong Nan Jiang Zheyuan Hu Weijian Luo Wei Deng Guang Lin

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 2 Monaten

Natürliche Sprachverarbeitung

Aufgabe

Haoyang Zheng Xinyang Liu Cindy Xiangrui Kong Nan Jiang Zheyuan Hu Weijian Luo Wei Deng Guang Lin

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Ultra-schnelle Sprachgenerierung durch diskrete Diffusions-Divergenz-Instruktion | Paper | HyperAI

Command Palette

Ultra-schnelle Sprachgenerierung durch diskrete Diffusions-Divergenz-Instruktion

Haoyang Zheng Xinyang Liu Cindy Xiangrui Kong Nan Jiang Zheyuan Hu Weijian Luo Wei Deng Guang Lin

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ultra-schnelle Sprachgenerierung durch diskrete Diffusions-Divergenz-Instruktion

Haoyang Zheng Xinyang Liu Cindy Xiangrui Kong Nan Jiang Zheyuan Hu Weijian Luo Wei Deng Guang Lin

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Ultra-schnelle Sprachgenerierung durch diskrete Diffusions-Divergenz-Instruktion

Haoyang Zheng Xinyang Liu Cindy Xiangrui Kong Nan Jiang Zheyuan Hu Weijian Luo Wei Deng Guang Lin

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters