vor 2 Stunden

Dongrui Liu Yu Li Zhonghao Yang Peng Wang Guanxu Chen Yuejin Xie Qinghua Mao Wanying Qu Yanxu Zhu Tianyi Zhou

Zusammenfassung

Moderne Open-World-agents wie OpenClaw verfügen über leistungsstarke Fähigkeiten zur umgebungsübergreifenden Ausführung, führen jedoch eine breite Palette neuer Sicherheitsrisiken ein. Gleichzeitig senken fortschrittliche Frontier-KI-Modelle die Angriffsbarrieren drastisch, wodurch aktuelle agent alignment frameworks für den realen Einsatz unzureichend werden. Um diesen aufkommenden Bedrohungen zu begegnen, schlagen wir ein leichtgewichtiges und skalierbares Framework für die agent safety alignment vor. Konkret aktualisieren wir die agent safety taxonomy, um neu auftretende Risiken aus Codex- und OpenClaw-Ausführungsszenarien zu berücksichtigen. Darüber hinaus entwickeln wir eine taxonomy-guided data engine mit influence-function purification, um leichtgewichtige AgentDoG-1.5-Varianten (0.8B, 2B, 4B und 8B Parameter) zu trainieren, die lediglich rund 1k Samples verwenden und eine vergleichbare Leistung wie führende Closed-Source-Modelle (z. B. GPT-5.4) erzielen. Auf Basis von AgentDoG 1.5 konstruieren wir eine hocheffiziente Umgebung für das agentic safety SFT und RL Training, die den Deployment-Overhead in Docker-Umgebungen um zwei Größenordnungen reduziert. Abschließend setzen wir AgentDoG 1.5 als training-free online guardrail für die Echtzeit-Sicherheitsmoderation ein. Umfangreiche experimentelle Ergebnisse belegen, dass AgentDoG 1.5 in diversen und komplexen interaktiven agentic Szenarien state-of-the-art Leistungen erzielt. Alle Modelle und Datensätze werden öffentlich zugänglich gemacht.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

vor 2 Stunden

Agent

Tongyi Qianwen

xAI

Dongrui Liu Yu Li Zhonghao Yang Peng Wang Guanxu Chen Yuejin Xie Qinghua Mao Wanying Qu Yanxu Zhu Tianyi Zhou

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

vor 2 Stunden

Agent

Tongyi Qianwen

xAI

Dongrui Liu Yu Li Zhonghao Yang Peng Wang Guanxu Chen Yuejin Xie Qinghua Mao Wanying Qu Yanxu Zhu Tianyi Zhou

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

AgentDoG 1.5: Ein leichtgewichtiges und skalierbares Alignment-Framework für AI Agent-Sicherheit und -schutz

Dongrui Liu Yu Li Zhonghao Yang Peng Wang Guanxu Chen Yuejin Xie Qinghua Mao Wanying Qu Yanxu Zhu Tianyi Zhou40 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

AgentDoG 1.5: Ein leichtgewichtiges und skalierbares Alignment-Framework für AI Agent-Sicherheit und -schutz

Dongrui Liu Yu Li Zhonghao Yang Peng Wang Guanxu Chen Yuejin Xie Qinghua Mao Wanying Qu Yanxu Zhu Tianyi Zhou40 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

AgentDoG 1.5: Ein leichtgewichtiges und skalierbares Alignment-Framework für AI Agent-Sicherheit und -schutz

Dongrui Liu Yu Li Zhonghao Yang Peng Wang Guanxu Chen Yuejin Xie Qinghua Mao Wanying Qu Yanxu Zhu Tianyi Zhou40 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Dongrui Liu Yu Li Zhonghao Yang Peng Wang Guanxu Chen Yuejin Xie Qinghua Mao Wanying Qu Yanxu Zhu Tianyi Zhou

Dongrui Liu Yu Li Zhonghao Yang Peng Wang Guanxu Chen Yuejin Xie Qinghua Mao Wanying Qu Yanxu Zhu Tianyi Zhou

Dongrui Liu Yu Li Zhonghao Yang Peng Wang Guanxu Chen Yuejin Xie Qinghua Mao Wanying Qu Yanxu Zhu Tianyi Zhou