Command Palette
Search for a command to run...
T-Wix Russischer SFT-Datensatz
Date
Size
Paper URL
T-Wix ist ein russischer SFT-Datensatz, und das zugehörige Papier ist „Von Quantität zu Qualität: Steigerung der LLM-Leistung durch selbstgesteuerte Datenauswahl zur Anweisungsoptimierung“, dessen Ziel darin besteht, die Fähigkeiten des Modells von der Lösung algorithmischer und mathematischer Probleme bis hin zu Dialogen, logischem Denken und Argumentationsmustern zu verbessern.
Der Datensatz enthält 499.598 russische Sprachproben, darunter 468.614 allgemeine Proben aus verschiedenen Bereichen wie Mathematik, Naturwissenschaften, Programmierung, Allgemeinwissen, Unterrichtsbefolgen und Rollenspiele. Die Beispiele zum Schlussfolgerungsvermögen enthalten 30.984 Datenpunkte, die sich auf fortgeschrittene mathematische und naturwissenschaftliche Probleme konzentrieren und detaillierte Schlussfolgerungsspuren liefern.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.