vor 6 Monaten

Zusammenfassung

Verallgemeinerung und Robustheit sind beide zentrale Anforderungen bei der Entwicklung von maschinellen Lernmethoden. Adversariales Training kann die Robustheit verbessern, doch zeigt die bisherige Forschung oft, dass es die Verallgemeinerung beeinträchtigt. In der natürlichen Sprachverarbeitung (NLP) haben vortrainierte große neuronale Sprachmodelle wie BERT erhebliche Fortschritte bei der Verallgemeinerung verschiedener Aufgaben demonstriert, wobei sich die Leistung durch adversariales Feintuning weiter steigern lässt. Dennoch bleiben diese Modelle weiterhin anfällig für adversariale Angriffe. In diesem Artikel zeigen wir, dass adversariales Vortrainieren sowohl die Verallgemeinerung als auch die Robustheit verbessern kann. Wir stellen einen allgemeinen Algorithmus ALUM (Adversarial training for large neural LangUage Models) vor, der das Trainingsziel durch Anwendung von Störungen im Embedding-Raum regularisiert, die die adversariale Verlustfunktion maximieren. Wir präsentieren die erste umfassende Studie zum adversarialen Training über alle Phasen hinweg, einschließlich Vortrainings von Grund auf, kontinuierlichen Vortrainings auf bereits gut trainierten Modellen sowie aufgabenbezogenen Feintuning. ALUM erreicht erhebliche Verbesserungen gegenüber BERT bei einer Vielzahl von NLP-Aufgaben, sowohl in normalen als auch in adversarialen Szenarien. Selbst bei Modellen, die bereits auf extrem großen Textkorpora gut trainiert wurden, wie RoBERTa, kann ALUM durch kontinuierliches Vortrainen signifikante Verbesserungen erzielen, während herkömmliche nicht-adversariale Methoden hier keine Verbesserungen mehr liefern. ALUM lässt sich zudem mit aufgabenbezogenem Feintuning kombinieren, um zusätzliche Leistungssteigerungen zu erzielen. Der ALUM-Code ist öffentlich unter https://github.com/namisan/mt-dnn verfügbar.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Xiaodong Liu Hao Cheng Pengcheng He Weizhu Chen Yu Wang Hoifung Poon Jianfeng Gao

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Xiaodong Liu Hao Cheng Pengcheng He Weizhu Chen Yu Wang Hoifung Poon Jianfeng Gao

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Antagonistische Ausbildung für große neuronale Sprachmodelle

Xiaodong Liu Hao Cheng Pengcheng He Weizhu Chen Yu Wang Hoifung Poon Jianfeng Gao

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Antagonistische Ausbildung für große neuronale Sprachmodelle

Xiaodong Liu Hao Cheng Pengcheng He Weizhu Chen Yu Wang Hoifung Poon Jianfeng Gao

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Antagonistische Ausbildung für große neuronale Sprachmodelle

Xiaodong Liu Hao Cheng Pengcheng He Weizhu Chen Yu Wang Hoifung Poon Jianfeng Gao

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters