Urania : Des aperçus confidentiels sur l'utilisation de l'intelligence artificielle par apprentissage différentiel
Urania : Des aperçus confidentiels sur l'utilisation de l'intelligence artificielle par apprentissage différentiel

Résumé
Nous présentons Urania, un nouveau cadre permettant de générer des insights sur les interactions entre utilisateurs et chatbots basés sur les modèles de langage à grande échelle (LLM), tout en offrant des garanties rigoureuses de confidentialité différentielle (DP). Ce cadre repose sur un mécanisme de regroupement privé et sur des méthodes innovantes d'extraction de mots-clés, incluant des approches fondées sur la fréquence, le TF-IDF et des méthodes guidées par un LLM. En exploitant des outils de DP tels que le regroupement, la sélection de partitions et la synthèse par histogrammes, Urania assure une protection de la vie privée de bout en bout. Notre évaluation mesure la préservation du contenu lexical et sémantique, la similarité des paires de données, ainsi que des métriques basées sur les LLM, en comparant les résultats à ceux d’un pipeline non privé inspiré de Clio (Tamkin et al., 2024). En outre, nous avons développé une évaluation empirique simple qui démontre la robustesse accrue de notre pipeline à base de DP. Les résultats montrent que le cadre est capable d’extraire des insights conversationnels significatifs tout en garantissant une protection stricte de la vie privée des utilisateurs, parvenant ainsi à un équilibre efficace entre utilité des données et préservation de la confidentialité.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.