HyperAI

SynthID-Text KI-Tool Zur Generierung Von Textwasserzeichen

1. Einführung in das Tutorial

SynthID ist eine 2024 von Google DeepMind eingeführte Technologie, die KI-generierte Inhalte mit Wasserzeichen versehen und identifizieren kann, indem digitale Wasserzeichen direkt in KI-generierte Bilder, Audiodateien, Texte oder Videos eingebettet werden. Eine ausführlichere technische Beschreibung dieses Ansatzes finden Sie unter Natur Das Papier „Skalierbares Wasserzeichen zur Identifizierung großer Sprachmodellausgaben“ in .

In diesem Tutorial geht es um SynthID-Text, eine Wasserzeichentechnik zum Identifizieren und Überprüfen von Texten, die von Large Language Models (LLMs) generiert werden. Dadurch kann die Textqualität erhalten und eine hohe Erkennungsgenauigkeit erreicht werden, während gleichzeitig die Latenzkosten minimiert werden. Der Kern dieser Technologie besteht darin, ein nahezu unmerkliches Wasserzeichen einzubetten, indem der Token-Wahrscheinlichkeitswert während des Generierungsprozesses leicht angepasst wird, ohne die Textqualität und das Benutzererlebnis zu beeinträchtigen, wodurch eine hohe Erkennungsgenauigkeit erreicht wird. SynthID-Text hat keinen Einfluss auf das LLM-Training, lediglich das Sampling-Verfahren wird geändert und die Wasserzeichenerkennung ist rechnerisch effizient, ohne das zugrunde liegende LLM zu verwenden.

Dieses Tutorial demonstriert das Modell mit Gemma-2b-it und der verwendete Wasserzeichendetektor ist Mean (der schnell demonstriert werden kann und nicht trainiert wird).Antworten mit Wasserzeichen haben tendenziell höhere Durchschnittswerte als Antworten ohne Wasserzeichen., die Testergebnisse entsprechen 2 Wertungen:

  • Durchschnittliche Punktzahl: Um die Antwort zu klassifizieren, können Sie einen Punkteschwellenwert festlegen. Dieser hängt jedoch von der Punkteverteilung für Ihren Anwendungsfall und Ihren erwarteten Falsch-Positiv-/Falsch-Negativ-Raten ab.
  • Gewichtete Durchschnittspunktzahl: Die Funktion zur gewichteten Durchschnittspunktzahl bietet eine bessere Klassifizierungsleistung als die Funktion zur durchschnittlichen Punktzahl (insbesondere erzielen mit Wasserzeichen versehene Antworten eine höhere Punktzahl).

2. Bedienungsschritte

Klicken Sie nach dem Starten des Containers auf die API-Adresse, um zur Weboberfläche zu gelangen

Eingabeaufforderungswort eingeben

Geben Sie das Eingabewort in das Dialogfeld ein und klicken Sie auf „Senden“. Das Modell generiert zwei Antworten, eine ohne Wasserzeichen und eine mit Wasserzeichen. Anschließend wird mithilfe des Wasserzeichenerkennungstools eine Bewertungsnote erstellt.

Abbildung 1: Generierung und Erkennung von Wasserzeichentext

Beim Vergleich der beiden oben genannten Werte ist es umso wahrscheinlicher, dass ein Wasserzeichen hinzugefügt wurde, je höher der Wert ist. Nach der Produktion kann ein Wasserzeichenschwellenwert festgelegt werden, um zu bestimmen, ob dem Ausgabetext ein Wasserzeichen hinzugefügt wird.

Austausch und Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓