HyperAI초신경

Mol-Instructions 대규모 생물분자 지침 데이터 세트

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

Mol-Instructions는 대규모 언어 모델을 위해 설계된 대규모 생물분자 지침 데이터 세트입니다. 2024년 저장대학교 연구팀이 개발했습니다. 관련 논문 결과는 다음과 같습니다.Mol-Instructions: 대규모 언어 모델을 위한 대규모 생물분자 지침 데이터 세트"는 ICLR 2024에 승인되었습니다.

데이터 세트에는 분자 지향 지침, 단백질 지향 지침, 생체 분자 텍스트 지침의 세 가지 유형의 지침이 포함되어 있습니다. 생체 분자 분야에서 대규모 언어 모델의 이해와 예측 능력을 향상시키기 위해 풍부한 지침 데이터를 제공하는 것을 목표로 합니다.

분자 가이드에는 다양한 화학 반응과 분자 설계 과제를 포함하여 소분자의 기본적인 특성과 행동을 다루는 148,400개의 지침이 들어 있습니다. 단백질 기반 지침에는 단백질 구조, 기능 및 활동 예측을 다루는 505,000개의 지침이 포함되어 있으며, 텍스트 지침을 기반으로 한 단백질 설계도 포함되어 있습니다. Biomolecule Text Instructions에는 주로 생물정보학 및 화학정보학 분야의 자연어 처리 작업을 위한 53,000개의 지침이 포함되어 있습니다.

Mol-Instructions.torrent
시딩 2다운로드 중 1완료됨 41총 다운로드 횟수 46
  • Mol-Instructions/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
        • Mol-Instructions.zip
          260.89 MB