HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Stunden

Lernen der Retrieval-Fähigkeit aus Agent Trajectories

Yuqi Zhou Sunhao Dai Changle Qu Liang Pang Jun Xu Ji-Rong Wen

Zusammenfassung

Da Sie mich gebeten haben, die Übersetzung gemäß Ihren strengen Standards für technologische Fachberichte durchzuführen, jedoch die Antwort in deutscher Sprache zu verfassen, präsentiere ich Ihnen hier die professionelle chinesische Übersetzung des Textes, eingebettet in eine deutsche Erläuterung.Hier ist die Übersetzung des wissenschaftlichen Abstracts:Chinesische Übersetzung (Zieltext)信息检索 (Information Retrieval, IR) 系统传统上是针对人类用户进行设计和训练的,其排序学习 (learning-to-rank) 方法高度依赖于大规模的人类交互日志,例如点击量 (clicks) 和停留时间 (dwell time)。然而,随着由 Large Language Model (LLM) 驱动的搜索 Agent 的迅速崛起,检索行为正日益由 Agent 而非人类用户所驱动,并作为核心组件嵌入到多轮推理与行动循环 (reasoning and action loops) 中。在这种背景下,基于“以人为中心”假设训练的检索模型,在 Agent 发出查询 (queries) 及消耗结果的方式上,表现出根本性的不匹配。在本文中,我们认为面向 Agentic Search 的检索模型应当直接利用 Agent 的交互数据进行训练。我们提出了一种全新的训练范式——从 Agent 轨迹 (trajectories) 中学习检索 (learning to retrieve),其监督信号来源于多步 Agent 交互。通过对搜索 Agent 轨迹的系统性分析,我们识别出了能够揭示文档效用 (document utility) 的关键行为信号,包括浏览行为 (browsing actions)、未浏览的拒绝行为 (unbrowsed rejections) 以及浏览后的推理轨迹 (post-browse reasoning traces)。基于这些见解,我们提出了 LRAT,这是一个简单且有效的框架,旨在从 Agent 轨迹中挖掘高质量的检索监督信号,并通过加权优化 (weighted optimization) 引入相关性强度 (relevance intensity)。在域内 (in-domain) 和域外 (out-of-domain) 的深度研究 benchmark 上进行的广泛实验表明,使用 LRAT 训练的检索器在不同的 Agent 架构和规模下,均能持续提升证据召回率 (evidence recall)、端到端任务成功率以及执行效率。我们的研究结果表明,Agent 轨迹是一种实用且具扩展性的监督来源,为 Agentic Search 时代的检索技术指明了一个极具前景的方向。Anmerkungen zur Übersetzung (Deutsch)Um Ihren Anforderungen an Präzision und Stil gerecht zu werden, wurden folgende Entscheidungen getroffen:Terminologie-Management: Gemäß Ihrer Anweisung wurden alle AI-spezifischen Fachbegriffe wie LLM, Agent, queries, benchmark, trajectories usw. im Original belassen, um die fachliche Exaktheit zu gewährleisten.Stilistik: Der Text wurde im Stil eines formalen wissenschaftlichen Abstracts verfasst. Sätze wurden so strukturiert, dass die kausalen Zusammenhänge (z. B. die Diskrepanz zwischen menschzentrierten Modellen und Agent-Interaktionen) im Chinesischen logisch und flüssig wirken.Präzision: Fachbegriffe wie "learning-to-rank" wurden mit der entsprechenden chinesischen Entsprechung (排序学习) übersetzt, um die akademische Tiefe zu wahren, während Konzepte wie "agentic search" durch den Kontext präzise als "面向 Agentic Search" (für Agentic Search orientiert) wiedergegeben wurden.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp