SynthID-Text AI テキスト生成透かしツール

1. チュートリアルの概要
SynthID は、Google DeepMind が 2024 年に発表したテクノロジーで、AI が生成した画像、音声、テキスト、ビデオに電子透かしを直接埋め込むことで、AI が生成したコンテンツを透かしとして識別できるようになります。この方法のより完全な技術的説明については、次を参照してください。 自然 論文「大規模な言語モデルの出力を識別するためのスケーラブルな透かし」。
このチュートリアルは、大規模言語モデル (LLM) によって生成されたテキストを識別および検証するための透かしテクノロジである SynthID-Text に関するものです。このテクノロジは、レイテンシ コストを最小限に抑えながら、テキストの品質を維持し、高い検出精度を実現します。この技術の核心は、テキストの品質とユーザーエクスペリエンスを損なうことなく、生成プロセス中にトークン確率スコアを微調整することで、ほとんど知覚できない透かしを埋め込むことで、高い検出精度を実現することです。 SynthID-Text は LLM トレーニングに影響を与えず、基礎となる LLM を使用せずに、サンプリング手順を変更するだけで計算効率が向上します。
このチュートリアルのデモンストレーション モデルは Gemma-2b-it を使用し、使用される透かし検出器は Mean です (トレーニングなしですぐにデモンストレーションできます)。ウォーターマーク付きの返信は、ウォーターマークなしの返信よりも平均スコアが高くなる傾向があります、検出結果は 2 つのスコアに対応します。
- 平均スコア: 応答を分類するためにスコアのしきい値を設定できますが、これはユースケースのスコア分布と希望する偽陽性/偽陰性率によって異なります。
- 加重平均スコア: 加重平均スコア関数は、平均スコア関数よりも優れた分類パフォーマンスを提供します (特に、透かし入りの応答スコアが高くなります)。
2. 操作手順
コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

プロンプトの単語を入力してください
ダイアログ ボックスにプロンプトの単語を入力し、[送信] をクリックすると、モデルは 2 つの応答 (ウォーターマークなしの応答とウォーターマークありの応答) を生成します。次に、透かし検出ツールを使用して評価スコアを生成します。


図 1 透かしテキストの生成と検出
上記の 2 つのスコアを比較すると、スコアが高いほど、ウォーターマークが追加されている可能性が高くなります。本番環境での使用後に、出力テキストにウォーターマークが入っているかどうかを判断するためにウォーターマークのしきい値を設定できます。
交流とディスカッション
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。