Datum

vor 2 Monaten

Paper-URL

Tags

Deep Aligned Visual Safety Prompt (DAVSP) wurde im November 2025 von einem Forschungsteam der Tsinghua-Universität vorgeschlagen, und die entsprechenden Forschungsergebnisse wurden in der Arbeit „DAVSP: Sicherheitsausrichtung für große Bild-Sprach-Modelle durch tief ausgerichtete visuelle Sicherheitshinweise„Es wurde von AAAI 2026 akzeptiert.“

DAVSP ist eine neuartige, sichere Ausrichtungsmethode für großskalige Spracherkennungsmodelle (LVLMs). Sie verbessert effektiv die Widerstandsfähigkeit von LVLMs gegenüber bösartigen Anfragen und erhält gleichzeitig deren Praktikabilität für harmlose Anfragen. Die Methode konstruiert einen trainierbaren Padding-Bereich um das Eingabebild als visuelles Sicherheitsmerkmal. Dadurch bleiben die ursprünglichen visuellen Merkmale erhalten und der durch Pixelstörungen verursachte Leistungsengpass wird beseitigt. Dies führt zu einem Paradigmenwechsel durch visuelle Sicherheitsmerkmale (VSP). Die Forschung schlägt außerdem eine neuartige Trainingsstrategie namens Deep Alignment (DA) vor. Ausgehend von der Beobachtung, dass LVLMs schädliche Informationen in ihrem Aktivierungsraum kodieren, konstruieren die Forscher einen schädlichen Vektor. Dieser erfasst die semantische Richtung in der internen Repräsentation des Modells und unterscheidet so zwischen bösartigen und harmlosen Anfragen.

Verwandt Wiki

Zerlegter Vorwärtspass (DePass)

DePass wird verwendet, um das Transformer-Modell durch Zerlegung des Vorwärtsdurchlaufs zu interpretieren.

vor einem Monat

iSeal-Fingerabdruckerkennungsmethode

iSeal erzielt eine Fingerabdruck-Erfolgsrate (FSR) von 100% gegen mehr als 10 Angriffe auf 12 LLMs.

vor einem Monat

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

Durch die Nutzung von GPU-Parallelität zur effizienten Erweiterung des Dekodierungsbaums wird eine schnelle und skalierbare Optimierung des Inferenzpfads erreicht.

vor einem Monat

SoCE-Klassenexpertensuppe

SoCE ist ein Modelloptimierungsparadigma, das auf einem automatischen, kategorienorientierten Expertenauswahlmechanismus basiert und mit mehreren Benchmark-Aufgaben kombiniert wird.

vor einem Monat

WorldGen

WorldGen ist in der Lage, geometrisch einheitliche, visuell reichhaltige und hocheffiziente Echtzeit-Rendering-Welten zu erzeugen.

vor einem Monat

Dichter Retriever

Die dichte Suchmaschine ist dafür verantwortlich, aus einer riesigen Dokumentenbibliothek schnell die für die Suchanfrage relevantesten Abschnitte zu finden und ist die zentrale Grundlage des Systems zur Generierung von Suchverbesserungen.

vor 24 Tagen

Fähigkeiten

Skills sind wiederverwendbare Fähigkeitsmodule, die Wissen und Prozesse kapseln und es KI ermöglichen, sich von Allzweckmodellen in spezialisierte intelligente Agenten zu verwandeln.

vor einem Monat

Geführte Gedankenverstärkung

GTR kann das Modelldenken in komplexen visuellen Umgebungen steuern und einen „Zusammenbruch des Gehirns“ verhindern.

vor 24 Tagen

Modell Suppen

Durch Model Souping kann ein besseres Modell erzeugt werden, indem die Gewichte mehrerer Feinabstimmungen gemittelt werden.

vor einem Monat

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Datum

vor 2 Monaten

Paper-URL

2506.09353

Verwandt Wiki

Zerlegter Vorwärtspass (DePass)

DePass wird verwendet, um das Transformer-Modell durch Zerlegung des Vorwärtsdurchlaufs zu interpretieren.

vor einem Monat

iSeal-Fingerabdruckerkennungsmethode

iSeal erzielt eine Fingerabdruck-Erfolgsrate (FSR) von 100% gegen mehr als 10 Angriffe auf 12 LLMs.

vor einem Monat

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

Durch die Nutzung von GPU-Parallelität zur effizienten Erweiterung des Dekodierungsbaums wird eine schnelle und skalierbare Optimierung des Inferenzpfads erreicht.

vor einem Monat

SoCE-Klassenexpertensuppe

SoCE ist ein Modelloptimierungsparadigma, das auf einem automatischen, kategorienorientierten Expertenauswahlmechanismus basiert und mit mehreren Benchmark-Aufgaben kombiniert wird.

vor einem Monat

WorldGen

WorldGen ist in der Lage, geometrisch einheitliche, visuell reichhaltige und hocheffiziente Echtzeit-Rendering-Welten zu erzeugen.

vor einem Monat

Dichter Retriever

vor 24 Tagen

Fähigkeiten

Skills sind wiederverwendbare Fähigkeitsmodule, die Wissen und Prozesse kapseln und es KI ermöglichen, sich von Allzweckmodellen in spezialisierte intelligente Agenten zu verwandeln.

vor einem Monat

Geführte Gedankenverstärkung

GTR kann das Modelldenken in komplexen visuellen Umgebungen steuern und einen „Zusammenbruch des Gehirns“ verhindern.

vor 24 Tagen

Modell Suppen

Durch Model Souping kann ein besseres Modell erzeugt werden, indem die Gewichte mehrerer Feinabstimmungen gemittelt werden.

vor einem Monat

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Sicherheitsvergleichsmethode: Tief Ausgerichtete Visuelle Sicherheitshinweise

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Sicherheitsvergleichsmethode: Tief Ausgerichtete Visuelle Sicherheitshinweise

Verwandt Wiki

Zerlegter Vorwärtspass (DePass)

iSeal-Fingerabdruckerkennungsmethode

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

SoCE-Klassenexpertensuppe

WorldGen

Dichter Retriever

Fähigkeiten

Geführte Gedankenverstärkung

Modell Suppen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Sicherheitsvergleichsmethode: Tief Ausgerichtete Visuelle Sicherheitshinweise

Verwandt Wiki

Zerlegter Vorwärtspass (DePass)

iSeal-Fingerabdruckerkennungsmethode

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

SoCE-Klassenexpertensuppe

WorldGen

Dichter Retriever

Fähigkeiten

Geführte Gedankenverstärkung

Modell Suppen

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Wiki

Zerlegter Vorwärtspass (DePass)

iSeal-Fingerabdruckerkennungsmethode

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

SoCE-Klassenexpertensuppe

WorldGen

Dichter Retriever

Fähigkeiten

Geführte Gedankenverstärkung

Modell Suppen

Verwandt Wiki

Zerlegter Vorwärtspass (DePass)

iSeal-Fingerabdruckerkennungsmethode

Sparse-Code-Baum-Dekodierungsbaum-Skizzierung

SoCE-Klassenexpertensuppe

WorldGen

Dichter Retriever

Fähigkeiten

Geführte Gedankenverstärkung

Modell Suppen