STL-10-Datensatz Bilderkennungsdatensatz
Datum
Größe
Veröffentlichungs-URL
Kategorien
Der STL-10-Datensatz ist ein Bilderkennungsdatensatz, der zur Entwicklung von Algorithmen für unbeaufsichtigtes Merkmalslernen, Deep Learning und Selbstlernen verwendet wird. Es basiert auf dem CIFAR-10-Datensatz mit einigen Modifikationen. Jede Kategorie enthält weniger gekennzeichnete Trainingsbeispiele als CIFAR-10, bietet jedoch größere unbeschriftete Instanzen für das überwachte Training von Bildlernmodellen, die unbeschriftete Daten verwenden, um eigene Vordaten aufzubauen, wobei hochauflösende Bilder verwendet werden können, um skalierbarere Methoden des unbeaufsichtigten Lernens zu entwickeln.
Dieser Datensatz wurde 2011 von der Stanford University veröffentlicht. Die Hauptherausgeber waren Adam Coates, Honglak Lee und Andrew Y. Ng. Das zugehörige Dokument trägt den Titel „Eine Analyse von Single-Layer-Netzwerken beim unüberwachten Feature-Learning“.