2달 전
ChatGPT를 활용한 구성적 일반화를 위한 데이터 증강: 오픈 인텐트 검출 사례 연구
Yihao Fang; Xianzhi Li; Stephen W. Thomas; Xiaodan Zhu

초록
개방형 의도 감지는 자연어 이해의 중요한 측면으로, 사용자가 생성한 텍스트에서 이전에 본 적 없는 의도를 식별하는 것을 포함합니다. 이 분야에서의 진전에도 불구하고, 언어 구성 요소의 새로운 조합을 처리하는 데 여전히 어려움이 있으며, 이는 조합적 일반화를 위한 필수적인 요소입니다. 본 논문에서는 ChatGPT를 데이터 증강 기술로 활용하여 개방형 의도 감지 작업에서 조합적 일반화를 강화하는 사례 연구를 제시합니다. 먼저, 이 문제를 평가하기 위한 기존 벤치마크의 한계점을 논의하며, 개방형 의도 감지 작업에서 조합적 일반화를 해결하기 위한 데이터셋 구축의 필요성을 강조합니다. ChatGPT가 생성한 합성 데이터를 학습 과정에 통합함으로써, 우리의 접근 방식이 모델 성능을 효과적으로 향상시킬 수 있음을 보여줍니다. 여러 벤치마크에 대한 철저한 평가는 우리의 방법이 기존 기술을 능가하고 개방형 의도 감지 능력을 크게 향상시키는 것을 확인하였습니다. 우리의 연구 결과는 ChatGPT와 같은 대규모 언어 모델이 자연어 이해 작업에서 데이터 증강을 위해 활용될 가능성을 부각시킵니다.