HyperAI초신경

TaskCraft: 자동화된 에이전틱 작업 생성

Shi, Dingfeng ; Cao, Jingyi ; Chen, Qianben ; Sun, Weichen ; Li, Weizhen ; Lu, Hongxuan ; Dong, Fangchen ; Qin, Tianrui ; Zhu, King ; Yang, Minghao ; Yang, Jian ; Zhang, Ge ; Liu, Jiaheng ; Zhang, Changwang ; Wang, Jun ; Jiang, Yuchen Eleanor ; Zhou, Wangchunshu
발행일: 6/17/2025
TaskCraft: 자동화된 에이전틱 작업 생성
초록

에이전트가 자율성을 가지고 여러 단계의 문제 해결을 수행하며 도구 사용과 적응적 추론이 필요한 에이전틱 작업(agentic tasks)이 자연어 처리(NLP)와 인공지능(AI)의 발전에서 점점 더 중심적인 역할을 하고 있습니다. 그러나 기존의 지시 데이터는 도구 상호작용을 포함하지 않고, 현재의 에이전틱 벤치마크는 비용이 많이 드는 인간 주석에 의존하여 확장성에 제한을 받고 있습니다. 우리는 \textsc{TaskCraft}를 소개합니다. \textsc{TaskCraft}는 난이도 조절, 다중 도구 사용, 그리고 실행 경로가 있는 검증 가능한 에이전틱 작업을 자동으로 생성하는 워크플로입니다. TaskCraft는 깊이 기반과 폭 기반 확장을 사용하여 구조적이고 계층적으로 복잡한 도전 과제를 만들기 위해 원자적 작업(atomic tasks)을 확장합니다. 경험적 결과에 따르면 이러한 작업은 생성 워크플로에서 프롬프트 최적화를 개선하고, 에이전틱 기초 모델(supervised fine-tuning of agentic foundation models)의 감독 학습 미세 조정을 향상시키는 것으로 나타났습니다. 우리는 에이전트 튜닝 및 평가에 대한 미래 연구를 지원하기 위해 약 36,000개의 다양한 난이도를 가진 대규모 합성 데이터셋을 제시합니다.