HyperAI초신경

Magpie-Pro-300K-Filtered 고품질 정렬 데이터 세트

날짜

10달 전

크기

469.91 MB

기관

앨런 인공지능 연구소
워싱턴대학교

발행 주소

huggingface.co

카테고리

特色图像

Magpie-Pro-300K-Filtered 데이터 세트는 Llama-3 70B에서 추출한 Magpie 방법을 사용하여 합성된 고품질 명령어 데이터 세트입니다. 이 데이터 세트에는 정렬된 LLM의 자기회귀 속성을 활용하여 사용자 쿼리와 해당 답변을 생성하는 자동화된 자체 합성 프로세스를 통해 생성된 약 30만 개의 고품질 대화가 포함되어 있습니다.

이 데이터 세트는 Llama 3 70B Instruct에서 제공합니다. 사용 까치 생성하다. 또한 참조종이그리고코드베이스자세한 내용은.

필터링된 데이터입니다. Magpie-Pro-300K-Filtered와 Magpie-Pro-MT-300K를 둘 다 사용하여 모델을 미세 조정하지 마십시오. 첫 번째 라운드에서는 두 모델이 거의 동일하기 때문입니다.

데이터 세트 배경

Magpie-align 프로젝트는 Magpie라는 이름의 대규모 언어 모델(LLM)에서 직접 고품질 지침 데이터를 합성하는 자체 합성 방법입니다. 이 프로젝트의 핵심 아이디어는 정렬된 LLM(예: Llama-3-Instruct)의 자기회귀 속성을 활용하여 사전 쿼리 템플릿만 입력하여 사용자 쿼리를 생성하는 것입니다. 이러한 접근 방식을 통해 Magpie는 수백만 개의 명령어와 해당 응답을 생성하고, 이 중에서 고품질 인스턴스를 선택하여 데이터 세트를 형성할 수 있습니다.

Magpie-Pro-300K-Filtered.torrent
시딩 2다운로드 중 1완료됨 58총 다운로드 횟수 70
  • Magpie-Pro-300K-Filtered/
    • README.md
      1.91 KB
    • README.txt
      3.83 KB
      • data/
        • Magpie-Pro-300K-Filtered.zip
          469.91 MB