HyperAI

Mol-Instructions Umfangreicher Biomolekularer Anweisungsdatensatz

Datum

vor 5 Monaten

Größe

260.89 MB

Organisation

Zhejiang-Universität

Veröffentlichungs-URL

github.com

*Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Mol-Instructions ist ein umfangreicher biomolekularer Anweisungsdatensatz, der für große Sprachmodelle entwickelt wurde. Es wurde 2024 von einem Forschungsteam der Zhejiang-Universität erstellt. Die zugehörigen Ergebnisse der Studie lauten:Mol-Instructions: Ein umfangreicher biomolekularer Anweisungsdatensatz für große Sprachmodelle", wurde von ICLR 2024 angenommen.

Der Datensatz enthält drei Arten von Anweisungen: molekülorientierte Anweisungen, proteinorientierte Anweisungen und biomolekulare Textanweisungen. Ziel ist es, umfangreiche Anweisungsdaten bereitzustellen, um das Verständnis und die Vorhersagefähigkeiten großer Sprachmodelle im Bereich der Biomoleküle zu verbessern.

Der Molecular Guide enthält 148.400 Anweisungen zu den grundlegenden Eigenschaften und Verhaltensweisen kleiner Moleküle und umfasst eine Vielzahl chemischer Reaktionen und Aufgaben zum Moleküldesign. Die proteinorientierten Anweisungen enthalten 505.000 Anweisungen zur Vorhersage von Proteinstruktur, -funktion und -aktivität sowie zum Proteindesign auf der Grundlage von Textanweisungen. Biomolecule Text Instructions enthält 53.000 Anweisungen, hauptsächlich für Aufgaben der natürlichen Sprachverarbeitung in den Bereichen Bioinformatik und Cheminformatik.

Mol-Instructions.torrent
Seeding 2Herunterladen 1Abgeschlossen 41Gesamtdownloads 46
  • Mol-Instructions/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
        • Mol-Instructions.zip
          260.89 MB