Microsoft Löscht Bekannte Datensätze Und Klärt Damit Das Rätsel Um Den Datenschutz Auf

Vor einigen Tagen hat Microsoft still und heimlich einen öffentlichen Datensatz mit Bildern von Prominenten gelöscht. Dieser Datensatz enthält 100.000 Gesichtsbilder von Prominenten und wird häufig für das Training der Gesichtserkennung verwendet. Wir kennen den wahren Grund für die Löschung durch Microsoft nicht, aber die damit verbundenen Datenschutzprobleme, einschließlich der Sicherheitsstandards der Gesichtserkennungstechnologie, geben Anlass zur Besinnung.
Microsoft hat letzte Woche einen Datensatz mit Bildern von Prominenten entfernt. Dies war einst der weltweit größte öffentliche Datensatz zur Gesichtserkennung, er ist jedoch über die Kanäle von Microsoft nicht mehr zugänglich.
Welche Hintergründe stecken hinter dieser „stillen“ Löschung?
Das Problem, das Microsoft lösen möchte: MS Celeb Promi-Datensatz
Der MS Celeb 1M Datensatz wurde erstmals 2016 von Microsoft veröffentlicht und enthält 100.000 Prominente, fast 10 Millionen Gesichtsbilder, und diese Daten werden aus dem Internet gesammelt.
Wir haben aus einer Million Prominenten im Internet 100.000 anhand ihrer Popularität ausgewählt und dann mithilfe einer Suchmaschine etwa 100 Bilder von jeder Person herausgezogen, um diesen riesigen Datensatz zu erhalten.

Dieser Datensatz wurde ursprünglich für den Wettbewerb verwendet. MSR IRC Es handelt sich um einen der weltweit anspruchsvollsten Bilderkennungswettbewerbe. Ursprünglich wurde für diesen Wettbewerb der Datensatz MS Celeb 1M verwendet.
MS Celeb 1M wird häufig für das Training der Gesichtserkennung verwendet. Da diese Bilder jedoch alle aus dem Internet stammen, wurden sie in Frage gestellt. Microsoft sagte, dass es auf Creative Commons License CC-Vereinbarung, um diese Bilder zu erfassen und abzurufen.
Gemäß der Vereinbarung dürfen die Fotos für wissenschaftliche Forschungszwecke wiederverwendet werden (die abgebildeten Personen erteilen hierfür nicht unbedingt die Erlaubnis, die Urheberrechtsinhaber jedoch schon). Doch nachdem Microsoft den Datensatz freigegeben hat, hat es keine Kontrolle mehr über dessen Verwendung. Die Financial Times führte eine eingehende Untersuchung durch und stellte fest, dass die Daten in großem Umfang in mehreren Unternehmenstests verwendet werden.
Unternehmen wie IBM, Panasonic, Alibaba, Nvidia und Hitachi haben diesen Datensatz verwendet.
Dies bringt einige normative Probleme bei der Verwendung von Datensätzen mit sich. Ein Forscher wies auch darauf hin, dass es sich dabei umGesichtEthische, Provenienz- und Datenschutzprobleme bei der Identifizierung von Bilddatensätzen.
Löschgrund: Hat der für diesen Datensatz zuständige Mitarbeiter das Unternehmen verlassen?
Microsoft hat MS Celeb 1M stillschweigend und ohne besondere Erklärung aus dem Internet entfernt.

In einem Bericht der Financial Times sagte Microsoft „Der Hauptzweck dieser Website ist akademischen Zwecken.“Der Grund für die Löschung ist, dass„Der Mitarbeiter, der das Projekt geleitet hat, hat das Unternehmen verlassen und arbeitet nicht mehr bei Microsoft, daher wurde es gelöscht.“
Wir alle glauben, dass es andere Gründe geben muss, vielleicht gibt es Probleme mit den Bildern im Datensatz. Microsoft erklärte allerdings, dass die Datensätze alle aus Fotos von Persönlichkeiten des öffentlichen Lebens stammen. Es sind jedoch auch einige wenige nicht berühmte Persönlichkeiten darunter. Die Eigentümer dieser Gesichtsfotos haben Fragen und Kritik hinsichtlich der Verwendung ihrer Namen und Bildinformationen durch Microsoft geäußert.
Einige technische Mitarbeiter spekulierten auch, dass Microsoft wegen Verstoßes gegen die EU- Datenschutz-Grundverordnung (DSGVO)Was die Datenlöschung betrifft, so ist das Gesetz letztes Jahr in Kraft getreten und zielt darauf ab, den Datenschutz zu gewährleisten.

Microsoft erklärte jedoch, dass man sich nicht an die Bestimmungen der DSGVO gehalten habe und die mit dem Datensatz in Zusammenhang stehenden Websites einfach deshalb stillgelegt worden seien, weil „der Wettbewerb vorbei war“.
Natürlich hat Microsoft dieses Mal den MS Celeb-Datensatz entfernt.Dies verhindert jedoch nicht die normale Verwendung in der akademischen Forschung und anderen Kanälen.. Auch auf Tools zur Arbeit mit Datenbanken kann nun normal zugegriffen werden.
Häufig verwendete öffentliche Datensätze können auch Datenschutzprobleme aufweisen
Nach der Untersuchung der Financial Times löschten auch zwei weitere akademische Institutionen relevante Datensätze: die Duke University Duke MTMC-Überwachungsdatensatzund der Stanford University Brainwash-Datensatz.
Dies ist nicht das erste Mal, dass Fragen im Zusammenhang mit Datensätzen und Datenschutz in den Fokus der Öffentlichkeit geraten. Ende Januar dieses Jahres veröffentlichte IBM einen millionenfachen, unvoreingenommenen Datensatz zur „Gesichtsvielfalt“, der große Kontroversen auslöste.
Obwohl IBM betonte, dass dieser Schritt dazu dienen soll, das Problem der „Verzerrung“ bei der Gesichtserkennung zu verringern, haben die Quelle des Datensatzes und der Bekanntheitsgrad der Charaktere viele Fragen aufgeworfen.
Einige Medien berichteten auch, dass IBM angekündigt habe, die entsprechenden Fotos im Datensatz entsprechend den Wünschen der Betroffenen zu löschen. Dabei handelte es sich jedoch lediglich um einseitige Aussagen und es wurden keine tatsächlichen Maßnahmen ergriffen.

Die Regeln für die Erfassung und Verwendung von Datensätzen sind noch immer sehr unklar, insbesondere dank der Annehmlichkeiten des Internets können viele Institutionen problemlos große Mengen an Bildern für Zwecke wie die Gesichtserkennung erhalten.
Tatsächlich kann die Lösung der mit dem Datensatz verbundenen Datenschutzprobleme sehr einfach sein:Wenn es um die Privatsphäre der Nutzer geht, muss das Recht des Nutzers auf Information gewährleistet sein und es muss sichergestellt sein, dass er bereit ist, Daten bereitzustellen..
Doch was zu fehlen scheint, ist nie die Methode, sondern das Bewusstsein.