HyperAIHyperAI

Command Palette

Search for a command to run...

ManyTypes4TypeScript: Ein umfassender TypeScript-Datensatz für sequenzbasierte Typinferenz

Premkumar T. Devanbu Kevin Jesse

Zusammenfassung

In diesem Paper stellen wir ManyTypes4TypeScript vor, eine sehr große Korpus-Datenmenge zum Trainieren und Evaluieren von maschinellen Lernmodellen für sequenzbasierte Typinferenz in TypeScript. Das Datenset enthält über 9 Millionen Typannotierungen aus insgesamt 13.953 Projekten und 539.571 Dateien. Es ist etwa zehnmal größer als vergleichbare Datensätze für die Typinferenz in Python und damit das größte verfügbare Datenset für TypeScript. Zudem bieten wir API-Zugriff auf das Datenset an, das in beliebige Tokenizer integriert und mit jeder state-of-the-art sequenzbasierten Modellarchitektur verwendet werden kann. Schließlich präsentieren wir Analysen und Leistungsergebnisse für state-of-the-art code-spezifische Modelle als Baseline. ManyTypes4TypeScript ist auf Hugging Face, Zenodo und CodeXGLUE verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp