HyperAI

Outil De Génération De Filigrane De Texte SynthID-Text AI

1. Introduction au tutoriel

SynthID est une technologie lancée par Google DeepMind en 2024 qui peut filigraner et identifier le contenu généré par l'IA en intégrant des filigranes numériques directement dans des images, de l'audio, du texte ou des vidéos générés par l'IA. Pour une description technique plus complète de cette approche, voir Nature L'article « Filigranage évolutif pour l'identification des sorties de modèles de langage volumineux » dans .

Ce tutoriel concerne SynthID-Text, une technique de tatouage numérique permettant d'identifier et d'authentifier les textes générés par les grands modèles linguistiques (LLM), qui maintient la qualité du texte et atteint une précision de détection élevée tout en minimisant les coûts de latence. Le cœur de cette technologie est d’intégrer un filigrane presque imperceptible en ajustant légèrement le score de probabilité du jeton pendant le processus de génération sans compromettre la qualité du texte et l’expérience utilisateur, obtenant ainsi une précision de détection élevée. SynthID-Text n'affecte pas la formation LLM, seule la procédure d'échantillonnage est modifiée et la détection de filigrane est efficace en termes de calcul sans utiliser le LLM sous-jacent.

Ce tutoriel démontre le modèle à l'aide de Gemma-2b-it, et le détecteur de filigrane utilisé est Mean (qui peut être démontré rapidement et n'est pas formé).Les réponses filigranées ont tendance à avoir des scores moyens plus élevés que les réponses non filigranées, les résultats du test correspondent à 2 scores :

  • Score moyen : pour classer la réponse, vous pouvez définir un seuil de score, mais cela dépendra de la distribution des scores pour votre cas d'utilisation et de vos taux de faux positifs/faux négatifs attendus.
  • Score moyen pondéré : la fonction de notation moyenne pondérée offre de meilleures performances de classification que la fonction de notation moyenne (en particulier, les réponses filigranées obtiennent un score plus élevé).

2. Étapes de l'opération

Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

Mot d'invite de saisie

Saisissez le mot d’invite dans la boîte de dialogue et cliquez sur Soumettre. Le modèle générera deux réponses, une sans filigrane et une avec filigrane. L'outil de détection de filigrane est ensuite utilisé pour générer un score d'évaluation.

Figure 1 Génération et détection de texte en filigrane

En comparant les deux scores ci-dessus, plus le score est élevé, plus il est probable qu'un filigrane ait été ajouté. Après la production, un seuil de filigrane peut être défini pour déterminer si un filigrane est ajouté au texte de sortie.

Échange et discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓