人机回圈(Human-in-the-loop,缩写为 HITL,也有人译为「人机协同」、「人在回环」、「人在循环」或「人机交互」等),它是人工智能的一个分支,利用人类和机器智能来创建机器学习模型。
HITL 是一种迭代反馈过程,人员(或团队)通过该过程与算法生成的系统(例如计算机视觉、机器学习或人工智能)进行交互。
每当人类提供反馈时,计算机视觉模型就会更新并调整其对世界的看法。反馈越协作和有效,模型更新越快,从训练过程中提供的数据集产生更准确的结果。就像父母会引导孩子的成长,解释猫会「喵喵」,狗会「汪汪」,直到孩子明白猫和狗的区别。
HITL 旨在实现算法和人类无法自行管理的目标。特别是在训练算法(例如计算机视觉模型)时,人类注释者或数据科学家提供反馈通常很有帮助,以便模型可以更清楚地了解所显示的内容。
在大多数情况下,HITL 流程可以部署在监督学习或无监督学习中。
在监督学习 HITL 模型开发中,注释者或数据科学家为计算机视觉模型提供标记和注释的数据集。 然后,HITL 输入允许模型为未标记的数据映射新的分类,以比人类团队更高的准确度填补空白。 HITL 提高了这一过程的准确性和输出,确保计算机视觉模型比没有人工干预时学习得更快、更成功。
在无监督学习中,计算机视觉模型被赋予大量未标记的数据集,迫使它们学习如何相应地构建和标记图像或视频。 HITL 输入通常更广泛,属于深度学习练习类别。
HITL 输入和反馈的总体目标是改善机器学习结果。 通过持续的人类反馈和输入,使机器学习或计算机视觉模型变得更加智能。在不断的人工帮助下,该模型可以产生更好的结果,提高准确性并更自信地识别图像或视频中的对象。
随着时间的推移,模型会得到更有效的训练,并通过人机反馈产生项目负责人所需的结果。这样,机器学习算法就能得到更有效的训练、测试、调整和验证。
尽管人机交互系统有很多优点,但也有缺点。
使用 HITL 流程可能缓慢且繁琐,而基于人工智能的系统可能会犯错误,人类也会犯错误。在这个过程中,人为错误会被忽视,然后无意中对模型的性能和输出产生负面影响。
因此需要使用机器来标注数据集。然而,一旦让人们更深入地参与机器学习模型的训练过程,可能会比人类不参与时花费更多的时间。
在医疗领域有一个具有基于医疗保健的图像和视频数据集示例。斯坦福大学 2018 年的一项研究发现,与人工智能模型在无人监督的情况下工作或人类数据科学家在没有基于人工智能的自动化支持的情况下处理相同数据集时相比,人工智能模型在 HITL 输入和反馈的情况下表现得更好。
人类和机器可以更好地工作并共同产生更好的结果。医疗领域只是使用人机交互机器学习模型的众多例子之一。
在对关键车辆或飞机部件进行质量控制和保证检查时,基于人工智能的自动化系统非常有用;然而,为了安心,人工监督至关重要。
当数据集很少并且正在输入模型时,HITL 输入就很有价值。例如包含稀有语言或工件的数据集,机器学习模型可能没有足够的数据可供借鉴,人类输入对于训练算法生成的模型非常宝贵。
【1】https://encord.com/glossary/what-is-human-in-the-loop-ai/