Command Palette
Search for a command to run...
OpenWebMath Trainingsdatensatz Für Offene Webmathematik
Date
Size
OpenWebMath ist ein Datensatz, der hochwertige mathematische Texte aus den meisten Teilen des Internets enthält. Es wird aus mehr als 200 Milliarden HTML-Dateien auf Common Crawl gefiltert und extrahiert, was zu einem Satz von 6,3 Millionen Dokumenten mit insgesamt 14,7 Milliarden Token führt. OpenWebMath ist für das Vortraining konzipiert undFeinabstimmungGroße Sprachmodelle.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.