OpenML-CC18-Datensatz Für Maschinelles Lernen
Datum
Veröffentlichungs-URL

OpenML-CC18 ist ein umfassender Datensatz für maschinelles Lernen. Der Datensatz wird durch eine standardisierte OpenML-basierte Schnittstelle und ergänzende Software-Toolkits ergänzt, die in Python, Java und R geschrieben sind. Dies zeigt, wie einfach umfassende Benchmarkstudien mithilfe einer standardisierten OpenML-basierten Benchmark-Suite und ergänzender Software-Toolkits durchgeführt werden können, die in Python, Java und R geschrieben sind. Die wichtigsten Unterscheidungsmerkmale der Datensätze sind die Benutzerfreundlichkeit (durch Methoden, die standardisierte Datenformate, APIs und vorhandene Clients verwenden); maschinenlesbare Metainformationen zum Inhalt des Sets und Online-Freigabe der Ergebnisse. Diese Funktionen ermöglichen Vergleiche im großen Maßstab. Der Datensatz ist eine Benchmark-Suite für maschinelles Lernen, die aus 72 Klassifizierungsdatensätzen besteht, die sorgfältig aus Tausenden von Datensätzen auf OpenML ausgewählt wurden.