Command Palette
Search for a command to run...
Wentao Zhang Yang Young Lu Yuntian Deng

摘要
传统的神经网络训练通常遵循固定且预先设定的优化流程,难以动态应对训练过程中的不稳定性或新出现的问题。本文提出了一种名为“交互式训练”(Interactive Training)的开源框架,该框架允许人类专家或自动化AI代理在神经网络训练过程中实现实时、基于反馈的干预。该框架的核心是一个控制服务器,用于协调用户或智能体与正在进行的训练过程之间的通信,使用户能够动态调整优化器超参数、训练数据以及模型检查点。通过三个案例研究,我们证明了交互式训练能够显著提升训练稳定性,降低对初始超参数的敏感性,并增强对用户需求变化的适应能力,为未来神经网络训练范式的发展铺平道路——在该范式中,AI代理将能够自主监控训练日志,主动识别并解决不稳定性问题,持续优化训练动态。