11 天前

大规模多任务动态ML系统的持续开发方法

Andrea Gesmundo
大规模多任务动态ML系统的持续开发方法
摘要

传统的机器学习(Machine Learning, ML)方法通常将开发与实验过程划分为一系列相互分离的迭代阶段,其反馈结果用于指导设计或调参决策。该方法存在诸多效率与可扩展性方面的缺陷,例如导致大量资源被投入于构建多个无法贡献于最终解决方案的试验性模型。本文提出的方法基于一种核心直觉:若将机器学习模型定义为模块化且可扩展的构件,则可引入一种全新的机器学习开发范式,实现将多个设计与评估迭代持续集成至单一无限扩展的智能系统中,从而实现系统的不断演进与增强。本文提出一种生成动态多任务机器学习模型的新方法,该方法通过一系列扩展与泛化操作实现模型构建。首先,我们采用标准的机器学习实证评估方法,对所提出方法的能力进行系统分析。随后,我们进一步提出一种新型的持续开发范式,能够在不中断现有大规模多任务机器学习系统运行的前提下,动态扩展其功能,并对所提方法扩展特性的性能进行深入分析。最终,我们成功构建出一个能够协同解决124项图像分类任务的机器学习模型,在达到当前最优性能水平的同时,显著降低了模型规模与计算开销。

大规模多任务动态ML系统的持续开发方法 | 最新论文 | HyperAI超神经