HyperAIHyperAI

Command Palette

Search for a command to run...

Winzige Bildänderungen umgehen KI-Sicherheitsfilter

Forschende der Florida International University haben nachgewiesen, dass minimale, mit bloßem Auge unsichtbare Bildmanipulationen die Sicherheitsschutzmechanismen von KI-Modellen wirksam umgehen können. Die Studie, die am Knight Foundation School of Computing and Information Sciences unter der Leitung von Professor Dr. Hadi Amini und seinem Team um Md Jueal Mia durchgeführt wurde, zeigt, dass gezielte Pixelstörungen sogenannte Jailbreaks ermöglichen. Die entwickelte Methode JaiLIP nutzt Algorithmen, um den optimalen Grad der Bildveränderung zu berechnen. Tests mit dem multimodalen Modell BLIP-2 ergaben, dass auf diese Weise manipulierte Bilder die Wahrscheinlichkeit schädlicher oder richtlinienwidriger KI-Antworten nahezu verdoppeln. Die Forschung, deren Ergebnisse im IEEE Xplore veröffentlicht wurden, konzentriert sich insbesondere auf kleinere Sprach- und Multimodalmodelle, die vermehrt von KMUs im Kundenservice, der Buchhaltung oder automatisierten Workflows eingesetzt werden. Da KI-Systeme Bilder als Zahlen- und Pixelmuster interpretieren und nicht wie Menschen ganzheitlich erfassen, lassen sie sich durch subtile Störungen zu unerwünschten Ausgaben verleiten. Ein konkretes Testbeispiel zeigte, wie ein optisch unverändert erscheinender Verkehrsschrank die KI dazu brachte, detaillierte Anweisungen zur Umgehung von Ampelkontrollen auszugeben. Die Implikationen dieser Schwachstelle gehen über reine Nutzerabfragen hinaus. Mit der steigenden Integration von KI in geschäftskritische Prozesse entstehen neue Angriffsvektoren, die das Vertrauen in automatisierte Dienste untergraben und Cyberangriffe erleichtern könnten. Dr. Amini betont, dass Unternehmen, die KI-Tools einsetzen, proaktive Sicherheitsmaßnahmen ergreifen müssen. Dazu zählen die Beschränkung sensibler Dateneingaben, insbesondere von Bilddaten, Zugangskontrollen sowie eine sorgfältige Prüfung der integrierten Schutzmechanismen vor der Implementierung. Das Forschungsteam sieht seine Arbeit als präventiven Ansatz. Durch das systematische Aufspüren von Sicherheitslücken im Vorfeld soll das Training künftiger KI-Modelle gezielt gestärkt werden. Das Ziel besteht darin, Systeme zu entwickeln, die auch versteckte Bedrohungen zuverlässig erkennen, noch bevor menschliche Nutzer sie wahrnehmen können. Die Erkenntnisse unterstreichen die Notwendigkeit robuster Sicherheitsarchitekturen in einer zunehmend KI-gestützten Wirtschaftswelt.

Verwandte Links