Urania: Differenziell private Einblicke in die Nutzung von KI
Urania: Differenziell private Einblicke in die Nutzung von KI

Abstract
Wir stellen Urania vor, einen neuartigen Rahmen zur Generierung von Erkenntnissen über Interaktionen mit LLM-Chatbots, der strenge Differential Privacy (DP)-Garantien bietet. Der Rahmen setzt eine private Clustering-Methode sowie innovative Ansätze zur Schlüsselwortextraktion ein, darunter frequenzbasierte, TF-IDF-basierte und durch LLM-gesteuerte Verfahren. Durch den Einsatz von DP-Tools wie Clustering, Partitionsauswahl und histogrammbasierte Zusammenfassung gewährleistet Urania einen end-to-end-Schutz der Privatsphäre. In unserer Evaluierung werden die Erhaltung lexikalischer und semantischer Inhalte, die Paarähnlichkeit sowie metrische Bewertungen mittels LLMs untersucht und mit einer nicht privaten, auf Clio zurückgehenden Pipeline (Tamkin et al., 2024) verglichen. Zudem entwickeln wir eine einfache empirische Privatsphäre-Evaluation, die die erhöhte Robustheit unseres DP-Pipelines belegt. Die Ergebnisse zeigen, dass der Rahmen in der Lage ist, bedeutungsvolle Erkenntnisse aus Gesprächen zu extrahieren, während gleichzeitig strenge Benutzerprivatsphäre gewahrt wird, und somit ein effektives Gleichgewicht zwischen Daten-Nutzbarkeit und Datenschutz gewährleistet.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.