vor 2 Tagen

Zusammenfassung

Die zunehmende Nutzung von Large Language Models (LLMs) in sensiblen Anwendungsbereichen hat die Notwendigkeit effektiver Watermarking-Techniken zur Sicherstellung der Provenienz und Verantwortlichkeit von KI-generierten Texten hervorgehoben. Die meisten bestehenden Watermarking-Verfahren erfordern jedoch Zugriff auf den Decodierungsprozess, was ihre Anwendbarkeit in realen Szenarien einschränkt. Ein anschauliches Beispiel ist der Einsatz von LLMs durch unredliche Gutachter im Rahmen des akademischen Peer-Reviews: Konferenzorganisatoren haben keinen Zugriff auf das verwendete Modell, müssen dennoch KI-generierte Gutachten identifizieren können.Vor dem Hintergrund dieser Lücke stellen wir In-Context Watermarking (ICW) vor, eine Methode, die Watermarks ausschließlich durch Prompt Engineering in generierte Texte einbettet und dabei die Fähigkeiten der LLMs im In-Context Learning und bei der Befolgung von Anweisungen nutzt. Wir untersuchen vier ICW-Strategien auf unterschiedlichen Granularitätsebenen, die jeweils mit einem maßgeschneiderten Detektionsverfahren gekoppelt sind. Zudem analysieren wir das Szenario der Indirect Prompt Injection (IPI) als spezifische Fallstudie, bei der die Watermarking-Funktionalität durch die modifizierte Eingabe von Dokumenten – etwa wissenschaftlichen Manuskripten – verdeckt ausgelöst wird.Unsere Experimente belegen die Machbarkeit von ICW als modellagnostischer und praxistauglicher Watermarking-Ansatz. Darüber hinaus deuten unsere Ergebnisse darauf hin, dass ICW mit fortschreitender Leistungsfähigkeit der LLMs eine vielversprechende Richtung für eine skalierbare und zugängliche Zuordnung von Inhalten darstellt.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 2 Tagen

LLM

Textgenerierung

Yepeng Liu Xuandong Zhao Christopher Kruegel Dawn Song Yuheng Bu

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 2 Tagen

LLM

Textgenerierung

Yepeng Liu Xuandong Zhao Christopher Kruegel Dawn Song Yuheng Bu

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Wasserzeichen im Kontext für Large Language Models

Yepeng Liu Xuandong Zhao Christopher Kruegel Dawn Song Yuheng Bu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Wasserzeichen im Kontext für Large Language Models

Yepeng Liu Xuandong Zhao Christopher Kruegel Dawn Song Yuheng Bu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Wasserzeichen im Kontext für Large Language Models

Yepeng Liu Xuandong Zhao Christopher Kruegel Dawn Song Yuheng Bu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters