2달 전

대화형 AI를 위한 통합 사전 학습 프레임워크

Siqi Bao; Bingjin Chen; Huang He; Xin Tian; Han Zhou; Fan Wang; Hua Wu; Haifeng Wang; Wenquan Wu; Yingzhan Lin
대화형 AI를 위한 통합 사전 학습 프레임워크
초록

본 연구에서는 PLATO-2를 다양한 대화 시스템에 적용하는 것을 탐구합니다. 이는 오픈 도메인 대화, 지식 기반 대화, 그리고 과제 지향적 대화를 포함합니다. PLATO-2는 초기에 오픈 도메인 챗봇으로 설계되어 두 단계의 커리큘럼 학습을 통해 훈련되었습니다. 첫 번째 단계에서는 간단한 일대일 매핑 관계에 맞추기 위해 거친 응답 생성 모델을 학습합니다. 이 모델은 과제 완성에서 의미론적 매핑이 결정적이 경향이 있기 때문에 과제 지향적 대화에 적용됩니다. 두 번째 단계에서는 다양한 응답 생성과 일관성 추정을 각각 위한 세부적인 생성 모델과 평가 모델을 추가로 학습합니다. 이러한 모델들은 일대다 매핑을 포착하는 데 우수한 능력을 가지고 있어 오픈 도메인 대화와 지식 기반 대화에 적합합니다. PLATO-2의 종합적인 평가를 위해 우리는 DSTC9의 여러 과제에 참여했습니다. 이는 오픈 도메인 대화의 상호 평가(트랙3-태스크2), 지식 기반 대화의 정적 평가(트랙3-태스크1), 그리고 엔드투엔드 과제 지향적 대화(트랙2-태스크1)를 포함합니다. PLATO-2는 모든 세 가지 과제에서 1위를 차지하여 다양한 대화 시스템을 위한 통합 프레임워크로서의 효과성을 입증하였습니다.

대화형 AI를 위한 통합 사전 학습 프레임워크 | 최신 연구 논문 | HyperAI초신경