HyperAI초신경

CoSQL 대화형 텍스트-SQL 데이터 세트

날짜

5달 전

크기

100.44 MB

기관

예일대학교

발행 주소

yale-lily.github.io

CoSQL(Conversational Text-to-SQL Challenge) 데이터 세트는 예일대학교에서 EMNLP2019에서 제안되었습니다. 이 연구의 목표는 여러 도메인에 걸친 일반 데이터베이스 쿼리 대화 시스템을 위한 데이터 세트를 구축하는 것입니다.

CoSQL은 3,000개 이상의 대화 그룹과 총 10,000개 이상의 주석이 달린 SQL 쿼리를 포함하고 있으며, 200개의 데이터베이스에 걸쳐 있으며, 서로 다른 데이터 그룹에서 사용하는 데이터베이스 간에 교차점이 없습니다. 이를 통해 모델의 견고성을 검사할 수 있습니다. 이 데이터 세트는 실제 시나리오에서의 데이터베이스 쿼리를 시뮬레이션합니다. 사용자는 여러 차례 문의를 할 수 있으므로 시스템은 정보를 통합할 수 있는 기능이 필요합니다.

CoSQL은 3가지 작업으로 구성됩니다.

  • SQL 기반 대화 상태 추적: 상호작용 기록을 기반으로 해당 SQL 문으로 변환됩니다.
  • 자연어 응답 생성: SQL 명령문과 반환된 결과를 기반으로 자연어 응답을 생성합니다.
  • 사용자 대화 행위 예측: 각 사용자의 질문에 대해 해당 질문이 어느 DB 사용자 태그에 속하는지 확인합니다.
CoSQL.torrent
시딩 2다운로드 중 1완료됨 43총 다운로드 횟수 68
  • CoSQL/
    • README.md
      1.54 KB
    • README.txt
      3.09 KB
      • data/
        • cosql_dataset.zip
          100.44 MB