HyperAIHyperAI

Command Palette

Search for a command to run...

Multimodale Fälschungserkennung mithilfe von Ensemble-Learning

Hsin-Min Wang Yu Tsao Chia Wen Lin Wasim Ahmad Sahibzada Adil Shahzad Ammarah Hashmi

Zusammenfassung

Die jüngste rasante Entwicklung der künstlichen Intelligenz (KI) hat die Erstellung von hochrealistischen Deepfakes ermöglicht, weshalb die Erkennung von Deepfake-Videos (auch als KI-synthesierte Videos bekannt) zu einer kritischen Aufgabe geworden ist. Die derzeitigen Systeme berücksichtigen die einheitliche Verarbeitung von Audio- und Videodaten häufig nicht vollständig, sodass noch erheblicher Verbesserungsbedarf besteht. In diesem Artikel konzentrieren wir uns auf die multimodale Fälschungserkennung und stellen eine tiefgreifende Fälschungserkennungsmethode auf Basis von audiovisuellen Ensemble-Lernverfahren vor. Die vorgeschlagene Methode besteht aus vier Komponenten: einem Video-Netzwerk, einem Audio-Netzwerk, einem Audiovisuellen Netzwerk sowie einem Abstimmungsmodul. Gegeben ein Video kann das vorgeschlagene multimodale Ensemble-Lernsystem identifizieren, ob es gefälscht oder echt ist. Experimentelle Ergebnisse auf einem kürzlich veröffentlichten multimodalen Datensatz namens FakeAVCeleb zeigen, dass die vorgeschlagene Methode eine Genauigkeit von 89 % erreicht und damit bestehende Modelle deutlich übertrifft.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp