2달 전

TripleNet: Triple Attention Network for Multi-Turn Response Selection in Retrieval-based Chatbots 트리플넷: 검색 기반 챗봇에서 다단계 응답 선택을 위한 트리플 어텐션 네트워크

Wentao Ma; Yiming Cui; Nan Shao; Su He; Wei-Nan Zhang; Ting Liu; Shijin Wang; Guoping Hu
TripleNet: Triple Attention Network for Multi-Turn Response Selection in Retrieval-based Chatbots
트리플넷: 검색 기반 챗봇에서 다단계 응답 선택을 위한 트리플 어텐션 네트워크
초록

우리는 상황 내에서 다양한 발화의 중요성이 일반적으로 현재 쿼리에 따라 달라짐을 고려하였습니다. 본 논문에서는 이전 연구들에서 사용된 <상황, 응답> 대신 <상황, 쿼리, 응답> 트리플을 완전히 모델링하기 위한 TripleNet 모델을 제안합니다. TripleNet의 핵심은 트리플 내의 관계를 네 단계로 모델링하는 새로운 주목 메커니즘인 트리플 주목(triple attention)입니다. 이 새로운 메커니즘은 각 요소의 표현을 다른 두 요소와 동시에 그리고 대칭적으로 주목하여 업데이트합니다. 우리는 응답을 중심으로 한 트리플을 문자 수준부터 상황 수준까지 일치시키어 예측을 수행합니다. 두 개의 대규모 다단계 응답 선택 데이터셋에 대한 실험 결과는 제안된 모델이 기존 최신 방법론들을 크게 능가할 수 있음을 보여줍니다. TripleNet 소스 코드는 https://github.com/wtma/TripleNet에서 이용 가능합니다.

TripleNet: Triple Attention Network for Multi-Turn Response Selection in Retrieval-based Chatbots 트리플넷: 검색 기반 챗봇에서 다단계 응답 선택을 위한 트리플 어텐션 네트워크 | 최신 연구 논문 | HyperAI초신경