HyperAI초신경

HalluQA 중국 대형 모델 환각 평가 데이터 세트

날짜

일 년 전

기관

상하이 인공 지능 연구소
복단대학교

발행 주소

github.com

카테고리

다운로드 도움말
特色图像

이 저장소에는 HalluQA(중국어 환각 질문 답변) 벤치마크에 대한 데이터와 평가 스크립트가 포함되어 있습니다. HalluQA의 전체 데이터는 HalluQA.json에 있습니다. HalluQA를 소개하는 논문과 중국어를 위한 여러 대규모 언어 모델의 자세한 실험 결과는 다음에서 확인할 수 있습니다.여기. HalluQA는 중국의 역사, 문화, 관습, 사회 현상을 고려하여 여러 영역을 망라하는 450개의 신중하게 설계된 적대적 질문을 담고 있습니다.