HyperAIHyperAI

Command Palette

Search for a command to run...

KI-Forschungsagenten: PA-DR-Training senkt Datenlecks

Aktuelle Entwicklungen im Bereich autonomer KI-Agenten haben ein kritisches Sicherheitsproblem zutage gefördert: Deep-Research-Agenten, die interne Unternehmensdaten mit öffentlicher Websuche kombinieren, bergen ein erhebliches Privatsphäre-Risiko. Forscher um Alexander Gurung haben in einer Veröffentlichung aus dem Jahr 2026 nachgewiesen, dass solche Systeme sensible Informationen ungewollt über ihren Suchverlauf preisgeben können. Phänomen ist der sogenannte Mosaik-Effekt: Jede einzelne Suchanfrage wirkt harmlos, doch die kumulierte Abfragehistorie ermöglicht es Dritten, aus verstreuten Fragmenten vertrauliche Daten zu rekonstruieren. Zur systematischen Untersuchung entwickelten die Autoren den Benchmark MosaicLeaks. Er umfasst tausend mehrstufige Rechercheaufgaben, die lokale Dokumente mit öffentlichem Webkontext verknüpfen. Die Messung erfolgt in drei Abstufungen: Intent Leakage offenbart das Forschungsziel, Answer Leakage ermöglicht die Beantwortung spezifischer Fragen allein durch die Historie, und Full-Information Leakage erlaubt das Ableiten interner Daten ohne Vorabfrage. Tests zeigten, dass Basisagenten regelmäßig Informationen leaken. Einfache Prompt-Anweisungen erwiesen sich als unwirksam und beeinträchtigten die Performance. Noch problematischer steigerte ein reines Training auf maximale Lösungsquote die Leakage-Rate, da die Modelle kontextreichere Suchanfragen generierten. Als Gegenmaßnahme stellten die Forscher die Trainingsmethode Privacy-Aware Deep Research vor. PA-DR kombiniert zwei Belohnungsmechanismen im Reinforcement Learning: Einen situativen Aufgabenreward, der jeden Planungsschritt präzise vergütet, und einen gelernten Privatsphäre-Reward. Letzterer nutzt einen Klassifikator, der direkte Datenpreisgaben oder das Zusammenfügen neuer Mosaiksteine bewertet und die entsprechende Planungsentcheidung sanktioniert. Dieser Ansatz durchbricht den Zielkonflikt zwischen Effizienz und Sicherheit. Die Ergebnisse sind eindeutig. Im Vergleich zum Basismodell stieg der strikte Erfolgsquotient der Agenten von 48,7 auf 58,7 Prozent, während die relevanten Leakage-Werte von 34,0 auf nur 9,9 Prozent sanken. Überraschend generierten die trainierten Agenten sogar mehr Suchanfragen, verzierten diese jedoch gezielt mit öffentlichen Details statt privaten Kennzahlen. Zudem erwies sich das Training als deutlich daten-effizienter und erreichte vergleichbare Performance mit einem Fünftel der bisherigen Daten. Die Autoren betonen, dass MosaicLeaks ein kontrolliertes Testumfeld darstellt. Die zentrale Schlussfolgerung lautet: Datenschutz lässt sich nicht durch Anweisungen implementieren, sondern muss durch gezieltes Reinforcement Learning in die Architektur integriert werden. PA-DR bietet einen messbaren Ansatz, um die Privatsphäre autonomer KI nachhaltig zu schützen, ohne ihre Leistungsfähigkeit zu beeinträchtigen.

Verwandte Links