인간 참여형(HITL)
인간 참여형(HITL, "인간-컴퓨터 협업", "인간 참여형", "인간 참여 사이클" 또는 "인간-컴퓨터 상호 작용" 등으로도 번역됨)은 인간과 기계의 지능을 사용하여 기계 학습 모델을 만드는 인공 지능의 한 분야입니다.
HITL은 개인(또는 팀)이 알고리즘으로 생성된 시스템(예: 컴퓨터 비전, 머신 러닝, 인공 지능)과 상호 작용하는 반복적 피드백 프로세스입니다.
사람이 피드백을 제공할 때마다 컴퓨터 비전 모델은 세상을 보는 관점을 업데이트하고 조정합니다. 피드백이 협력적이고 효과적일수록 모델이 더 빨리 업데이트되고, 학습 과정에서 제공된 데이터세트에서 더 정확한 결과를 생성합니다. 부모가 고양이는 야옹하고 개는 짖는다고 설명해 주고, 아이들이 고양이와 개를 구분할 때까지 지도하는 것과 마찬가지입니다.
히트엘 어떻게 작동하나요?
HITL은 알고리즘과 인간이 스스로 관리할 수 없는 목표를 달성하는 것을 목표로 합니다. 특히 컴퓨터 비전 모델과 같은 알고리즘을 훈련할 때 인간 주석자나 데이터 과학자가 피드백을 제공하면 모델이 표시되는 내용을 더 잘 이해할 수 있도록 하는 것이 도움이 되는 경우가 많습니다.
대부분의 경우, HITL 프로세스는 지도 학습이나 비지도 학습에 배포될 수 있습니다.
지도 학습 HITL 모델 개발에서 주석 작성자 또는 데이터 과학자는 컴퓨터 비전 모델에 레이블이 지정되고 주석이 달린 데이터 세트를 제공합니다. HITL 입력을 통해 모델은 레이블이 지정되지 않은 데이터에 대한 새로운 분류를 매핑하여 인간 팀보다 더 높은 정확도로 빈틈을 메울 수 있습니다. HITL은 이 과정의 정확도와 출력을 개선하여 컴퓨터 비전 모델이 인간의 개입 없이 학습할 때보다 더 빠르고 성공적으로 학습할 수 있도록 보장합니다.
비지도 학습에서 컴퓨터 비전 모델은 대규모의 레이블이 지정되지 않은 데이터 세트를 받고, 이에 따라 이미지나 비디오를 구성하고 레이블을 지정하는 방법을 학습해야 합니다. HITL 입력은 일반적으로 더 광범위하며 딥러닝 연습 범주에 속합니다.
이 전략은 어떻게 머신 러닝 결과를 개선합니까?
HITL 입력 및 피드백의 전반적인 목표는 머신 러닝 결과를 개선하는 것입니다. 지속적인 인간의 피드백과 입력을 통해 머신 러닝이나 컴퓨터 비전 모델을 더욱 스마트하게 만듭니다. 인간의 도움이 계속되면 모델은 더 나은 결과를 산출하고, 정확도를 높이며 이미지나 비디오 속의 객체를 더 확실하게 식별할 수 있습니다.
시간이 지남에 따라 모델은 더 효과적으로 훈련되고 인간과 기계의 피드백을 통해 프로젝트 리더가 필요로 하는 결과를 생성합니다. 이런 방식으로 머신 러닝 알고리즘을 보다 효율적으로 훈련, 테스트, 조정 및 검증할 수 있습니다.
HITL 워크플로의 단점
인간-컴퓨터 상호작용 시스템은 많은 장점이 있지만 단점도 있습니다.
HITL 프로세스를 사용하는 것은 느리고 번거로울 수 있으며, AI 기반 시스템은 사람과 마찬가지로 실수를 할 수 있습니다. 이 과정에서 인간의 실수가 눈에 띄지 않게 발생할 수 있으며 의도치 않게 모델의 성능과 출력에 부정적인 영향을 미칠 수 있습니다.
그러므로 데이터 세트에 주석을 달기 위해서는 기계가 필요합니다. 그러나 인간이 머신 러닝 모델을 훈련하는 과정에 더 깊이 관여하게 되면 인간이 관여하지 않을 때보다 더 많은 시간이 걸릴 수 있습니다.
히트엘 AI 훈련 예시
의료 분야에서는 의료 기반 이미지 및 비디오 데이터 세트의 예가 있습니다. 2018년 스탠포드 대학 연구에 따르면 AI 모델은 HITL 입력 및 피드백을 받은 경우 성능이 더 뛰어난 것으로 나타났으며, AI 모델이 인간의 감독 없이 작업하거나 인간 데이터 과학자가 AI 기반 자동화의 지원 없이 동일한 데이터 세트를 처리한 경우보다 성능이 더 뛰어난 것으로 나타났습니다.
인간과 기계는 함께 일하면 더 나은 결과를 낼 수 있습니다. 의료 분야는 인간과 컴퓨터 간의 상호작용을 위해 머신 러닝 모델을 사용하는 많은 예 중 하나일 뿐입니다.
AI 기반 자동화 시스템은 중요한 차량이나 항공기 구성품에 대한 품질 관리 및 보증 검사를 수행할 때 매우 유용합니다. 하지만 마음의 평화를 위해서는 인간의 감독이 필수적입니다.
데이터 세트가 작고 모델에 입력되는 경우 HITL 입력은 가치가 있습니다. 예를 들어, 희귀한 언어나 아티팩트가 포함된 데이터 세트의 경우 머신 러닝 모델이 학습할 수 있는 데이터가 충분하지 않을 수 있으며, 알고리즘이 생성한 모델을 학습하는 데는 인간의 입력이 매우 중요합니다.
참고문헌
【1】https://encord.com/glossary/what-is-human-in-the-loop-ai/