WebVision 1.0+2.0 Bildklassifizierungsdatensatz
Datum
Größe
Veröffentlichungs-URL
Lizenz
其他
Kategorien

Der WebVision-Datensatz ist ein umfangreicher Webbilddatensatz mit mehr als 2,4 Millionen Bildern, die von der Flickr-Website und der Google-Bildersuche gecrawlt wurden. Als zusätzliche Metainformationen werden zudem die entsprechenden Textinformationen des Bildes (wie Titel, Benutzer-Tags oder Beschreibung) bereitgestellt. Der Datensatz bietet einen Validierungssatz mit 50.000 Bildern (50 pro Klasse). Dieser Datensatz kann verwendet werden, um die Forschung zum Erlernen visueller Darstellungen aus verrauschten Webdaten voranzutreiben.
Für die Suche werden 1.000 Bilder mit demselben Konzept wie im ILSVRC 2012-Datensatz verwendet. Dadurch können vorhandene Methoden direkt für die wissenschaftliche Forschung verwendet und mit Modellen verglichen werden, die auf dem ILSVRC 2012-Datensatz trainiert wurden. Gleichzeitig ist es möglich, Probleme mit der Datensatzverzerrung in groß angelegten Szenarien zu untersuchen.
Dieser Datensatz umfasst die Versionen 1.0 und 2.0.