HyperAI超神経

Mol-命令の大規模生体分子命令データセット

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください

Mol-Instructions は、大規模な言語モデル用に特別に設計された大規模な生体分子指示データ セットで、2024 年に浙江大学の研究チームによって作成されました。関連する論文結果は「」です。Mol-命令: 大規模言語モデルのための大規模な生体分子命令データセット」が ICLR 2024 に受理されました。

このデータセットには、分子指向命令、タンパク質指向命令、生体分子テキスト命令の 3 種類の命令が含まれており、生体分子分野における大規模言語モデルの理解と予測能力を強化するための豊富な命令データを提供することを目的としています。

Molecular Oriented Instructions には、さまざまな化学反応や分子設計タスクを含む、小分子の基本的な特性と動作をカバーする 148,400 の命令が含まれています。タンパク質指向の指示には、タンパク質の構造、機能、活性予測に関連する 505,000 の指示と、テキスト指示ベースのタンパク質設計が含まれています。生体分子テキスト命令には 53,000 の命令が含まれており、主にバイオインフォマティクスおよびケモインフォマティクスの分野での自然言語処理タスクに使用されます。

Mol-Instructions.torrent
シーディング 2ダウンロード中 1ダウンロード完了 41総ダウンロード数 46
  • Mol-Instructions/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
        • Mol-Instructions.zip
          260.89 MB