Command Palette

Search for a command to run...

Mol-Instructions 대규모 생물분자 지침 데이터 세트

날짜

일 년 전

크기

260.89 MB

기관

저장대학교

발행 주소

github.com

논문 URL

arxiv.org

*이 데이터 세트는 온라인 사용을 지원합니다.여기를 클릭하여 이동하세요.

Mol-Instructions는 대규모 언어 모델을 위해 설계된 대규모 생물분자 지침 데이터 세트입니다. 2024년 저장대학교 연구팀이 개발했습니다. 관련 논문 결과는 다음과 같습니다.Mol-Instructions: 대규모 언어 모델을 위한 대규모 생물분자 지침 데이터 세트"는 ICLR 2024에 승인되었습니다.

데이터 세트에는 분자 지향 지침, 단백질 지향 지침, 생체 분자 텍스트 지침의 세 가지 유형의 지침이 포함되어 있습니다. 생체 분자 분야에서 대규모 언어 모델의 이해와 예측 능력을 향상시키기 위해 풍부한 지침 데이터를 제공하는 것을 목표로 합니다.

분자 가이드에는 다양한 화학 반응과 분자 설계 과제를 포함하여 소분자의 기본적인 특성과 행동을 다루는 148,400개의 지침이 들어 있습니다. 단백질 기반 지침에는 단백질 구조, 기능 및 활동 예측을 다루는 505,000개의 지침이 포함되어 있으며, 텍스트 지침을 기반으로 한 단백질 설계도 포함되어 있습니다. Biomolecule Text Instructions에는 주로 생물정보학 및 화학정보학 분야의 자연어 처리 작업을 위한 53,000개의 지침이 포함되어 있습니다.

Mol-Instructions.torrent
시딩 2다운로드 중 0완료됨 110총 다운로드 횟수 158
  • Mol-Instructions/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
        • Mol-Instructions.zip
          260.89 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp