Command Palette
Search for a command to run...
Technischer Bericht zu Tongyi DeepResearch
Technischer Bericht zu Tongyi DeepResearch
Zusammenfassung
Wir stellen Tongyi DeepResearch vor, ein agenzienbasiertes Großmodell für Sprachverarbeitung, das speziell für langfristige, tiefgreifende Informationsrecherchetaufgaben konzipiert ist. Um eine autonome, tiefgehende Forschungsagentur zu fördern, wurde Tongyi DeepResearch in einem end-to-end-Trainingsframework entwickelt, das agenzienbasierte Mid-Training- und Post-Training-Phasen kombiniert. Dies ermöglicht skalierbares Schließen und Informationsbeschaffung bei komplexen Aufgaben. Wir haben eine hochskalierbare, vollautomatisierte Daten-Synthesepipeline entworfen, die auf teure menschliche Annotationen verzichtet und alle Trainingsstadien unterstützt. Durch die Schaffung maßgeschneiderter Umgebungen für jedes Stadium gewährleistet unser System stabile und konsistente Interaktionen über den gesamten Prozess. Tongyi DeepResearch, das insgesamt 30,5 Milliarden Parameter umfasst, wobei pro Token nur 3,3 Milliarden aktiviert sind, erreicht state-of-the-art-Ergebnisse in einer Vielzahl agenzienbasierter Benchmarks für tiefgehende Forschung, darunter Humanity's Last Exam, BrowseComp, BrowseComp-ZH, WebWalkerQA, xbench-DeepSearch, FRAMES und xbench-DeepSearch-2510. Wir stellen das Modell, das Framework und die vollständigen Lösungen als Open Source zur Verfügung, um die Community zu stärken.