Wöchentliche Empfehlungen Der Redaktion | RJUA-QA-Medizindatensatz Gestartet, 3D-Molekulargenerationsmodell ResGen-Papieranalyse

Die neue Kolumne von HyperAI ist da~Jeden Montag wählt die Redaktion von HyperNeural die in der Vorwoche auf der offiziellen Website von hyper.ai aktualisierten Inhalte (Datensätze, AI4S-Papierfälle, Enzyklopädieeinträge) aus und veröffentlicht sie hier. Besuchen Sie hyper.ai direkt, um alle Inhalte anzuzeigen!
Vom 15. bis 21. Januar wurde die offizielle Website von hyper.ai schnell aktualisiert:
* Hochwertige öffentliche Datensätze: 10
* AI4S-Papierhüllen: 2
* Beliebte Enzyklopädieeinträge: 10
Besuchen Sie die offizielle Website:https://hyper.ai/
Ausgewählte öffentliche Datensätze
1. CrossDock2020:ResGen Für die Forschung aufbereitete Datensätze
Der anfängliche Datensatz enthält mehr als 22 Millionen Protein-Liganden-Paare. Dieser Datensatz kann für Studien zur Interaktion zwischen Proteinen und kleinen Molekülen verwendet werden, insbesondere zur Bewertung der Bindungsfähigkeit von Molekülen an Proteintaschen.
Direkte Verwendung:
https://hyper.ai/datasets/29021
2. RJUA-QA: Der erste Datensatz zum Beantworten von Fragen im chinesischen medizinischen Fachgebiet
RJUA-QA ist ein innovativer Datensatz zum Beantworten von Fragen und Antworten für das medizinische Fachgebiet der Urologie. Der Datensatz wurde vom Ant Group Medical LLM-Team in Zusammenarbeit mit einem Team von Urologie-Experten des Renji-Krankenhauses der Shanghai Jiao Tong University School of Medicine erstellt. Der Datensatz wurde entwickelt, um echte klinische Patientendaten in virtuelle klinische Patientengespräche umzuwandeln, die im Q-Kontext-A-Format (Frage-Kontext-Antwort) präsentiert werden.
Direkte Verwendung:
https://hyper.ai/datasets/28970
3. MetaMathQA-Datensatz zum mathematischen Denken
Um die Vorwärts- und Rückwärtsschlussfolgerungsfähigkeiten des Modells zu verbessern, schlugen Forscher aus Cambridge, der Hong Kong University of Science and Technology und von Huawei den MetaMathQA-Datensatz auf Grundlage von zwei häufig verwendeten mathematischen Datensätzen (GSM8K und MATH) vor: einen mathematischen Schlussfolgerungsdatensatz mit breiter Abdeckung und hoher Qualität. MetaMathQA besteht aus 395.000 vorwärts-rückwärts gerichteten mathematischen Frage-Antwort-Paaren, die von einem großen Sprachmodell generiert werden.
Direkte Verwendung:
https://hyper.ai/datasets/28954
4. M³IT Multimode-Mehrsprachen-Befehlsoptimierungsdatensatz
Der Datensatz besteht aus 40 Datensätzen mit 2,4 Millionen Instanzen und 400 manuell geschriebenen Aufgabenanweisungen, die in eine Vision-to-Text-Struktur neu formatiert wurden. Der Datensatz stellt eine Vielzahl von Aufgaben aus klassischen Vision-Language-Aufgaben zusammen, darunter Untertitelung, visuelle Frage- und Antwortfunktion (VQA), visuelle bedingte Generierung, Argumentation und Klassifizierung.
Direkte Verwendung:
https://hyper.ai/datasets/29048
5. ChatHaruhi-RolePlaying Rollenspiel-Dialogdatensatz
ChatHaruhi ist ein Datensatz mit 32 chinesischen/englischen TV-/Anime-Charakteren und über 54.000 simulierten Dialogen. Mit großen Sprachmodellen erstellte Rollenspiel-Chatbots haben große Aufmerksamkeit erregt. Um bestimmte fiktive Charaktere zu imitieren, schlug das Forschungsteam einen Algorithmus zur Steuerung des Sprachmodells durch verbesserte Eingabeaufforderungen und das Speichern von aus Skripten extrahierten Charakteren vor. Durch das Sammeln von Korpussen aus Filmen, Romanen und Drehbüchern und die Durchführung einer strukturierten Extraktion sammelte das Forschungsteam mehr als 23.000 Gesprächsnachrichten.
Direkte Verwendung:
https://hyper.ai/datasets/28926
Weitere aktualisierte Datensätze dieser Woche finden Sie unter:
WissenschaftKI ArgumentAusgewählte Fallstudien
Zhejiang-Universität undZhijiang-LaborDas Forschungsteam schlug ein 3D-Modell zur Molekülgenerierung auf der Grundlage von Proteintaschen vor – ResGen, das 8-mal schneller ist als die bisher beste Technologie und erfolgreich medikamentenähnliche Moleküle mit geringerer Bindungsenergie und höherer Diversität erzeugt. Der Artikel wurde in der Zeitschrift Nature veröffentlicht.
Den vollständigen Bericht ansehen:
Das Team von Luo Xiaozhou vom Shenzhen Institute of Advanced Technology der Chinesischen Akademie der Wissenschaften schlug ein Rahmenwerk zur Vorhersage enzymkinetischer Parameter (UniKP) vor, um die Vorhersage einer Vielzahl verschiedener enzymkinetischer Parameter zu erreichen. Der Artikel wurde in der Zeitschrift Nature veröffentlicht.
Den vollständigen Bericht ansehen:
Beliebte Enzyklopädieartikel
1. Sigmoidfunktion
2. Markov-Kette (Markov-Kette)
3. Stichwort Angriff (Sofortige Injektion)
4. Belohnungsmodell
5. Prompt Engineering
Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:
Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!
Bis nächste Woche!
Über HyperAI
HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:
* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze
* Enthält über 300 klassische und beliebte Online-Tutorials
* Interpretation von über 100 AI4Science-Papierfällen
* Unterstützt die Suche nach über 500 verwandten Begriffen
* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China
Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen: