HyperAI초신경

알파카 청소 지침 미세 조정 데이터 세트

날짜

10달 전

크기

13.98 MB

발행 주소

huggingface.co

Alpaca-Cleaned 데이터 세트는 스탠포드 대학이 2024년에 공개한 원래 Alpaca 데이터 세트의 정리된 버전입니다. 원래 Alpaca는 OpenAI(text-davinci-003) 엔진이 생성한 52,000개의 명령어와 데모로 구성된 데이터 세트입니다. 이러한 지침 데이터는 언어 모델에 대한 지침 조정을 수행하는 데 사용되어 언어 모델이 지침을 더 잘 따르도록 할 수 있습니다.

이 데이터 세트는 환각적인 답변, 병합된 지침, 빈 출력, 일관되지 않은 입력 필드와 같은 원래 Alpaca의 몇 가지 문제를 해결하여 데이터의 품질과 일관성을 개선했습니다. Alpaca-Cleaned 데이터 세트에는 텍스트 생성, 질문과 답변 시스템, 자연어 이해, 코드 이해 및 생성을 포함한 다양한 응용 시나리오가 있습니다. 이 솔루션의 특징으로는 품질 최적화, 성능 개선, 풍부한 모델 리소스, 오픈 소스 코드 및 커뮤니티 지원이 있습니다. 이는 커뮤니티 참여, 지속적인 업데이트 및 개선을 장려하며 NLP 분야의 발전을 촉진합니다.

Alpaca-Cleaned.torrent
시딩 1다운로드 중 0완료됨 139총 다운로드 횟수 144
  • Alpaca-Cleaned/
    • README.md
      1.57 KB
    • README.txt
      3.15 KB
      • data/
        • Alpaca-Cleaned.zip
          13.98 MB