Datensatzzusammenfassung | Das DeepFake-Chaos Ist Weit Verbreitet. Besiege Die Magie Mit Magie! Hochwertige Datensätze Helfen Bei Der Weiterentwicklung Der Technologie Zur Fälschungserkennung

Mit der rasanten Entwicklung der künstlichen Intelligenz wird die Gesichtserkennungstechnologie in den Bereichen Sicherheit, Zahlung, Einzelhandel und anderen Bereichen weithin eingesetzt und verbessert den Komfort und die Sicherheit des Lebens erheblich. Allerdings hat sich insbesondere im Hinblick auf den Datenschutz allmählich gezeigt, dass die Technologie auch ein zweischneidiges Schwert ist, und der Missbrauch der Gesichtserkennungstechnologie ist in den Fokus der gesellschaftlichen Aufmerksamkeit gerückt.
Laut der 315 Gala von CCTV sammelten und speicherten viele namhafte Unternehmen ohne Zustimmung der Verbraucher illegal Gesichtsinformationen, generierten einzigartige IDs und nutzten diese für spätere Geschäftsanalysen und Präzisionsmarketing. Dieses Verhalten stellt eine schwerwiegende Verletzung der Datenschutzrechte der Verbraucher dar und hat in der Gesellschaft große Besorgnis hervorgerufen.
Gleichzeitig ist die KI-gesteuerte Deep-Fake-Technologie DeepFake „nicht von der Realität zu unterscheiden“, stört die soziale Ordnung und verletzt das öffentliche Interesse. DeepFake verwendet riesige Mengen an Trainingsdaten, um zahlreiche gefälschte Fotos, Videos und Audios zu generieren. Der Gesichtsänderungsmodus ist so ausgefeilt, dass es für normale Menschen schwierig ist, subtile Unterschiede zu erkennen. Viele Kriminelle nutzen diese Technologie, um illegale Gewinne zu erzielen. Man geht davon aus, dass die Zahl der Kriminellen in Südkorea, die diese Technologie nutzen, um illegale Gewinne zu erzielen, bei bis zu 220.000 liegt.
Daher ist auf technischer Ebene die kontinuierliche Verbesserung der Gesichtserkennungs- und Fälschungserkennungstechnologie zur genauen Beurteilung dieser manipulierten DeepFake-Videos und -Bilder ein heißes Thema, das dringend gelöst werden muss. In diesem Artikel werden die häufig verwendeten Datensätze zur Gesichtserkennung und zu DeepFake sortiert und zusammengefasst, um Forschern dabei zu helfen, ihre Forschung in verwandten Bereichen bis zu einem gewissen Grad effektiver durchzuführen.
Klicken Sie hier, um weitere Open-Source-Datensätze anzuzeigen:
DeepFake/Gesichtserkennungsdatensatz
1.Datensatz zur Videoerkennung für Deepfake-Erkennung
Veröffentlichungsplattform:Kaggle
Veröffentlichungszeit:2024
Geschätzte Größe:22,5 GB
Downloadadresse:https://go.hyper.ai/B8dJf
Der Deepfake Detection-Datensatz ist speziell für die Aufgabe der Deepfake-Erkennung konzipiert und bietet eine umfassende Sammlung von Videosequenzen, die zum Trainieren und Bewerten von Deep-Learning-Modellen zur Identifizierung manipulierter Medien verwendet werden können. Es wurde vom offiziellen FaceForensics-Server heruntergeladen, der auf die Bereitstellung hochwertiger Datensätze zur Erkennung von Gesichtsmanipulationen spezialisiert ist.
2.LAV-DF Multimodaler audiovisueller Datensatz
Verlag:Monash University, Curtin University, Indian Institute of Technology Ropar
Veröffentlichungszeit:2022
Geschätzte Größe:23,11 GB
Downloadadresse:https://go.hyper.ai/wTcYE
LAV-DF ist ein multimodaler (Videomanipulation und Audiomanipulation) Datensatz, der aus dem VoxCeleb2-Datensatz abgeleitet wurde und 136.304 Videos enthält, darunter 36.431 echte Videos und 99.873 gefälschte Videos.
3.OpenForensics-Datensatz zur Gesichtsfälschungserkennung
Verlag:Nationales Institut für Informatik, Japan; Sokendaigaku-Universität, Japan; Universität Tokio
Veröffentlichungszeit:2021
Downloadadresse:https://go.hyper.ai/64Gn2
Der OpenForensics-Datensatz ist ein umfangreicher, anspruchsvoller Datensatz, der für vielschichtige Aufgaben zur Fälschungserkennung und -segmentierung entwickelt wurde. Der Datensatz besteht aus 115.000 Wildbildern und 334.000 Gesichtern. Alle Bilder verfügen über ausführliche Gesichtskommentare. Es unterstützt nicht nur Aufgaben zur Erkennung und Segmentierung von Fälschungen mehrerer Gesichter, sondern auch herkömmliche Aufgaben mit allgemeinen Gesichtern. Es bietet großes Potenzial für die Forschung zur Deep-Fake-Prävention und zur allgemeinen Gesichtserkennung.
4.ForgeryNet-Datensatz zur Gesichtsfälschung
Verlag:SenseTime Research, Universität für Post und Telekommunikation Peking, Shanghai Artificial Intelligence Laboratory, School of Software, Beihang University, Universität für Wissenschaft und Technologie Chinas, S-Lab, Nanyang Technological University
Veröffentlichungszeit:2021
Downloadadresse:https://go.hyper.ai/h9fii
Der ForgeryNet-Datensatz ist ein großer und umfassender Benchmark, der speziell für die Deepfake-Analyse entwickelt wurde. Es enthält 2,9 Millionen Bilder und 221.247 Videos, deckt 7 Fälschungsmethoden auf Bild- und 8 auf Videoebene aus der ganzen Welt ab und unterstützt 4 Aufgaben auf Bild- und Videoebene: Klassifizierung von Bildfälschungen, räumliche Fälschungslokalisierung, Klassifizierung von Videofälschungen und zeitliche Fälschungslokalisierung.
5.FFIW10K-Datensatz zur Gesichtsfälschung
Verlag:Computer Vision Laboratory, ETH Zürich, Institut für Künstliche Intelligenz, Beihang University, University of Technology Sydney
Veröffentlichungszeit:2021
Downloadadresse:https://go.hyper.ai/rstji
Der Datensatz umfasst 10.000 hochwertige Fake-Videos von YouTube mit durchschnittlich 3 Gesichtern pro Frame. Jedes Video enthält echte und falsche Gesichter, was den realen, komplexen Szenen näher kommt. Der Manipulationsprozess ist vollautomatisch und wird durch ein domänenübergreifendes Qualitätsbewertungsnetzwerk gesteuert, wodurch der Datensatz hochgradig skalierbar und mit geringen Arbeitskosten verbunden ist.
6.Datensatz menschlicher Gesichter
Veröffentlichungsplattform:Kaggle
Veröffentlichungszeit:2024
Geschätzte Größe:113,93 MB
Downloadadresse:https://go.hyper.ai/Ewakl
Der Datensatz enthält ungefähr 9,6.000 Gesichtsbilder, 5.000 echte Gesichtsbilder und 4,63.000 KI-generierte Gesichtsbilder.
7.Glint360K-Datensatz zur Gesichtserkennung
Verlag:DeepGlint
Veröffentlichungszeit:2021
Geschätzte Größe:161,46 GB
Downloadadresse:https://go.hyper.ai/j0rrB
Der Datensatz besteht aus etwa 17 Millionen Gesichtsbildern, darunter etwa 360.000 Identitäten. Es handelt sich um den bislang größten und saubersten Datensatz zur Gesichtserkennung. Es ist für das Trainieren und Auswerten groß angelegter Gesichtserkennungsmodelle konzipiert und wird häufig in der Gesichtserkennungsforschung und -entwicklung eingesetzt, insbesondere in Kombination mit Deep-Learning-Technologie.
8. FaceForensics-Datensatz zur Gesichtsfälschungserkennung
Verlag:Technische Universität München (TUM)
Veröffentlichungszeit:2020
Downloadadresse:https://go.hyper.ai/ItO9I
Dieser Datensatz enthält eine große Anzahl synthetischer und realer Gesichtsoperationen. Die Daten stammen aus verschiedenen Videos auf der YouTube-Plattform und decken mehrere ausgewählte Videoersteller ab. Mithilfe dieses Datensatzes können Forscher genauere und zuverlässigere Methoden zur Erkennung und Identifizierung gefälschter Gesichtsbilder und -videos entwickeln.
9.UTKFace-Datensatz zur Gesichtserkennung im großen Maßstab
Verlag:Amerikanische Universität
Veröffentlichungszeit:2017
Geschätzte Größe:1,45 GB
Downloadadresse:https://go.hyper.ai/8soAU
Der UTKFace-Datensatz ist ein umfangreicher Gesichtsdatensatz mit einer langen Altersspanne (von 0 bis 116 Jahren), der mehr als 20.000 Gesichtsbilder mit Anmerkungen zu Alter, Geschlecht und Rasse enthält. Die Figuren in den Bildern unterscheiden sich erheblich in Pose, Gesichtsausdruck, Beleuchtung, Okklusion, Auflösung usw. und können für verschiedene Aufgaben wie Gesichtserkennung, Altersschätzung, Vorhersage von Altersänderungen, Lokalisierung von Orientierungspunkten usw. verwendet werden.
10.CelebA-Gesichtsattribut-Datensatz
Verlag:Die Chinesische Universität von Hongkong
Veröffentlichungszeit:2015
Geschätzte Größe:16,92 GB
Downloadadresse:https://go.hyper.ai/l0j1L
Der CelebFaces (CelebA)-Datensatz ist ein umfangreicher Datensatz mit Gesichtsattributen mit mehr als 200.000 Bildern von Prominenten, von denen jedes mit 40 Attributen versehen ist und ein breites Spektrum an Posen und Hintergründen abdeckt. Die Anmerkungen von CelebA umfassen 10.177 Identitäten, 202.599 Gesichtsbilder und 5 charakteristische Standorte.
11.VGG-Face2-Gesichtserkennungsdatensatz
Verlag:Universität Oxford
Veröffentlichungszeit:2015
Geschätzte Größe:37,49 GB
Downloadadresse:https://go.hyper.ai/XKI0Z
VGG-Face2 Dataset ist ein Gesichtsbilddatensatz, der Gesichtsdaten von insgesamt 9.131 Personen enthält. Die Bilder stammen alle aus der Bildersuche von Google. Die Personen im Datensatz unterscheiden sich stark hinsichtlich Körperhaltung, Alter, Rasse und Beruf.
Oben sind die 11 von HyperAI zusammengestellten Datensätze zur Gesichtserkennung und DeepFake. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns gerne eine Nachricht hinterlassen oder Ihren Beitrag übermitteln!
Über HyperAI
HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:
* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze
* Enthält über 300 klassische und beliebte Online-Tutorials
* Interpretation von über 100 AI4Science-Papierfällen
* Unterstützt die Suche nach über 500 verwandten Begriffen
* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China
Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:
Abschließend empfehle ich eine akademische Austauschaktivität!
Zur dritten Live-Übertragung von Meet AI4S war Zhou Ziyi eingeladen, ein Postdoktorand am Institut für Naturwissenschaften der Shanghai Jiao Tong University und dem Shanghai National Center for Applied Mathematics. Klicken Sie hier, um einen Termin für die Live-Übertragung zu vereinbaren!
