HyperAI超神经

摘要

黑盒蒸馏（Black-box distillation）通过仅利用专有教师模型的文本输出进行学习，无需访问其内部的logits或参数，从而构建学生大型语言模型（LLM）。在本工作中，我们提出生成对抗蒸馏（Generative Adversarial Distillation, GAD），实现了在策略内（on-policy）且黑盒条件下的模型蒸馏。GAD将学生LLM视为生成器，训练一个判别器以区分学生生成的回答与教师模型的回答，从而形成一种极小极大博弈（minimax game）。在此过程中，判别器充当一个与学生模型共同演化的在策略奖励模型，提供稳定且自适应的反馈信号。实验结果表明，GAD在各项指标上均持续优于常用的序列级知识蒸馏方法。特别地，使用GAD训练的Qwen2.5-14B-Instruct（学生模型）在LMSYS-Chat自动评估中表现接近其教师模型GPT-5-Chat。这些结果证明，GAD是一种极具前景且高效的黑盒LLM蒸馏范式。

大语言模型的黑盒策略蒸馏

Tianzhu Ye Li Dong Zewen Chi Xun Wu Shaohan Huang Furu Wei

摘要

用 AI 构建 AI

Hyper Newsletters

Command Palette

大语言模型的黑盒策略蒸馏

Tianzhu Ye Li Dong Zewen Chi Xun Wu Shaohan Huang Furu Wei

摘要

用 AI 构建 AI

Hyper Newsletters