HyperAI
vor 9 Tagen

RedOne: Enthüllung der domänenbezogenen Post-Training von LLMs in sozialen Netzwerkdiensten

Fei Zhao; Chonggang Lu; Yue Wang; Zheyong Xie; Ziyan Liu; Haofu Qian; JianZhao Huang; Fangcheng Shi; Zijie Meng; Hongcheng Guo; Mingqian He; Xinze Lyu; Yiming Lu; Ziyang Xiang; Zheyu Ye; Chengqiang Lu; Zhe Xu; Yi Wu; Yao Hu; Yan Gao; Jun Fan; Xiaolong Jiang; Weiting Liu; Boyang Wang; Shaosheng Cao
RedOne: Enthüllung der domänenbezogenen Post-Training von LLMs in sozialen Netzwerkdiensten
Abstract

Als wichtiges Medium für die moderne Informationsverbreitung haben soziale Netzwerkdienste (SNS) ein rasches Wachstum erlebt, das erhebliche Herausforderungen für die Plattforminhaltsverwaltung und die Verbesserung der Interaktionsqualität aufgeworfen hat. Kürzlich haben große Sprachmodelle (LLMs) potenzielle Lösungen angeboten, aber bisherige Studien konzentrieren sich auf isolierte Aufgaben. Dies führt nicht nur zu einem abnehmenden Nutzen durch die Datenvergrößerung in einzelnen Szenarien, sondern behindert auch eine flexible Anpassung an vielfältige realweltliche Kontexte. Um diese Herausforderungen zu bewältigen, stellen wir RedOne vor, ein domänenspezifisches LLM, das entwickelt wurde, um den Leistungsengpass von Einzelaufgaben-Baselines zu überwinden und eine umfassende Grundlage für SNS zu schaffen. RedOne wurde durch eine dreistufige Trainingsstrategie entwickelt, die aus fortlaufender Vortrainierung, überwachter Feinabstimmung und Präferenzoptimierung besteht und mit einem groß angelegten realweltlichen Datensatz trainiert wurde. Durch umfangreiche Experimente zeigt RedOne starke allgemeine Fähigkeiten und erreicht durchschnittliche Verbesserungen von bis zu 14,02 % bei 8 wichtigen SNS-Aufgaben und 7,56 % im SNS-Zweisprachen-Evaluierungsbenchmark im Vergleich zu Basismodellen. Darüber hinaus führte RedOne bei Online-Tests zu einer Reduzierung des Erkennungsrates für schädliche Inhalte um 11,23 % und verbesserte die Seitenaufrate bei der Postansicht-Suche um 14,95 % im Vergleich zu Einzelaufgaben-Feinabstimmungs-Baselines. Diese Ergebnisse etablieren RedOne als robustes domänenspezifisches LLM für SNS, das ausgezeichnete Generalisierungsfähigkeiten in verschiedenen Aufgaben zeigt und vielversprechende Anwendbarkeit in realweltlichen Szenarien bietet.