HyperAIHyperAI

Command Palette

Search for a command to run...

TextBox 2.0: Eine Textgenerierbibliothek mit vortrainierten Sprachmodellen

Tianyi Tang; Junyi Li; Zhipeng Chen; Yiwen Hu; Zhuohao Yu; Wenxun Dai; Zican Dong; Xiaoxue Cheng; Yuhao Wang; Wayne Xin Zhao; Jian-Yun Nie; Ji-Rong Wen

Zusammenfassung

Um die Forschung zur Textgenerierung zu erleichtern, präsentiert dieser Artikel eine umfassende und einheitliche Bibliothek, TextBox 2.0, die sich auf den Einsatz von vortrainierten Sprachmodellen (PLMs) konzentriert. Um umfassend zu sein, umfasst unsere Bibliothek 13 gängige Textgenerierungsaufgaben und deren entsprechende 83 Datensätze sowie 45 PLMs, die allgemeine, Übersetzung, chinesische, dialogbasierte, steuerbare, distillierte, promptbasierte und leichtgewichtige PLMs abdecken. Wir implementieren zudem vier effiziente Trainingsstrategien und stellen vier Generierungsziele für das Vortrainieren neuer PLMs aus der Grundlage bereit. Um einheitlich zu sein, entwerfen wir die Schnittstellen so, dass sie den gesamten Forschungsprozess (von Datenladung bis hin zum Training und zur Bewertung) unterstützen, wodurch sicher gestellt wird, dass jeder Schritt auf einheitliche Weise durchgeführt werden kann. Trotz der vielfältigen Funktionalität ist unsere Bibliothek einfach zu bedienen, sei es über die benutzerfreundliche Python-API oder die Kommandozeile. Um die Effektivität unserer Bibliothek zu überprüfen, führen wir umfangreiche Experimente durch und illustrieren vier Arten von Forschungsszenarien. Das Projekt wird unter folgendem Link veröffentlicht: https://github.com/RUCAIBox/TextBox.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp