HyperAI초신경

SynthID-Text AI 텍스트 워터마크 생성 도구

1. 튜토리얼 소개

SynthID는 Google DeepMind가 2024년에 출시한 기술로, AI가 생성한 사진, 오디오, 텍스트 또는 비디오에 디지털 워터마크를 직접 삽입하여 AI가 생성한 콘텐츠를 식별하고 워터마크를 삽입할 수 있습니다. 이 접근 방식에 대한 보다 완전한 기술 설명은 다음을 참조하세요. 자연 .에 있는 "대용량 언어 모델 출력을 식별하기 위한 확장 가능한 워터마킹" 논문.

이 튜토리얼은 대규모 언어 모델(LLM)에서 생성된 텍스트를 식별하고 검증하는 워터마킹 기술인 SynthID-Text에 대한 것입니다. 이 기술은 텍스트 품질을 유지하고 지연 비용을 최소화하는 동시에 높은 탐지 정확도를 달성할 수 있습니다. 이 기술의 핵심은 텍스트 품질과 사용자 경험을 손상시키지 않고 생성 과정에서 토큰 확률 점수를 미세하게 조정하여 거의 감지할 수 없는 워터마크를 내장하여 높은 감지 정확도를 달성하는 것입니다. SynthID-Text는 LLM 학습에 영향을 미치지 않으며, 샘플링 절차만 수정되고 기본 LLM을 사용하지 않고도 워터마크 감지가 계산적으로 효율적입니다.

이 튜토리얼에서는 Gemma-2b-it을 사용하여 모델을 보여주고, 사용된 워터마크 감지기는 Mean입니다(빠르게 시연할 수 있으며 학습되지 않음).워터마크가 있는 응답은 워터마크가 없는 응답보다 평균 점수가 더 높은 경향이 있습니다., 테스트 결과는 2가지 점수에 해당합니다.

  • 평균 점수: 응답을 분류하려면 점수 임계값을 설정할 수 있지만, 이는 사용 사례에 대한 점수 분포와 예상되는 거짓 양성/거짓 음성 비율에 따라 달라집니다.
  • 가중 평균 점수: 가중 평균 점수 함수는 평균 점수 함수보다 더 나은 분류 성능을 제공합니다(특히, 워터마크가 있는 응답은 점수가 더 높습니다).

2. 작업 단계

컨테이너를 시작한 후 API 주소를 클릭하여 웹 인터페이스로 들어갑니다.

프롬프트 단어 입력

대화 상자에 프롬프트 단어를 입력하고 제출을 클릭합니다. 이 모델은 워터마크가 없는 응답 하나, 워터마크가 있는 응답 하나, 총 두 가지 응답을 생성합니다. 그런 다음 워터마크 감지 도구를 사용하여 평가 점수를 생성합니다.

그림 1 워터마크 텍스트 생성 및 감지

위의 두 점수를 비교해보면, 점수가 높을수록 워터마크가 추가되었을 가능성이 높습니다. 제작 후, 워터마크 임계값을 설정하여 출력 텍스트에 워터마크를 추가할지 여부를 결정할 수 있습니다.

교류 및 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓