HyperAI

Wöchentliche Empfehlungen Der Redaktion | RJUA-QA-Medizindatensatz Gestartet, 3D-Molekulargenerationsmodell ResGen-Papieranalyse

vor einem Jahr
Information
zhaorui
特色图像

Die neue Kolumne von HyperAI ist da~Jeden Montag wählt die Redaktion von HyperNeural die in der Vorwoche auf der offiziellen Website von hyper.ai aktualisierten Inhalte (Datensätze, AI4S-Papierfälle, Enzyklopädieeinträge) aus und veröffentlicht sie hier. Besuchen Sie hyper.ai direkt, um alle Inhalte anzuzeigen!

Vom 15. bis 21. Januar wurde die offizielle Website von hyper.ai schnell aktualisiert:

* Hochwertige öffentliche Datensätze: 10

* AI4S-Papierhüllen: 2

* Beliebte Enzyklopädieeinträge: 10

Besuchen Sie die offizielle Website:https://hyper.ai/

Ausgewählte öffentliche Datensätze

1CrossDock2020:ResGen  Für die Forschung aufbereitete Datensätze

Der anfängliche Datensatz enthält mehr als 22 Millionen Protein-Liganden-Paare. Dieser Datensatz kann für Studien zur Interaktion zwischen Proteinen und kleinen Molekülen verwendet werden, insbesondere zur Bewertung der Bindungsfähigkeit von Molekülen an Proteintaschen.

Direkte Verwendung:

https://hyper.ai/datasets/29021

2. RJUA-QA: Der erste Datensatz zum Beantworten von Fragen im chinesischen medizinischen Fachgebiet

RJUA-QA ist ein innovativer Datensatz zum Beantworten von Fragen und Antworten für das medizinische Fachgebiet der Urologie. Der Datensatz wurde vom Ant Group Medical LLM-Team in Zusammenarbeit mit einem Team von Urologie-Experten des Renji-Krankenhauses der Shanghai Jiao Tong University School of Medicine erstellt. Der Datensatz wurde entwickelt, um echte klinische Patientendaten in virtuelle klinische Patientengespräche umzuwandeln, die im Q-Kontext-A-Format (Frage-Kontext-Antwort) präsentiert werden.

Direkte Verwendung:

https://hyper.ai/datasets/28970

3. MetaMathQA-Datensatz zum mathematischen Denken

Um die Vorwärts- und Rückwärtsschlussfolgerungsfähigkeiten des Modells zu verbessern, schlugen Forscher aus Cambridge, der Hong Kong University of Science and Technology und von Huawei den MetaMathQA-Datensatz auf Grundlage von zwei häufig verwendeten mathematischen Datensätzen (GSM8K und MATH) vor: einen mathematischen Schlussfolgerungsdatensatz mit breiter Abdeckung und hoher Qualität. MetaMathQA besteht aus 395.000 vorwärts-rückwärts gerichteten mathematischen Frage-Antwort-Paaren, die von einem großen Sprachmodell generiert werden.

Direkte Verwendung:

https://hyper.ai/datasets/28954

4. M³IT Multimode-Mehrsprachen-Befehlsoptimierungsdatensatz

Der Datensatz besteht aus 40 Datensätzen mit 2,4 Millionen Instanzen und 400 manuell geschriebenen Aufgabenanweisungen, die in eine Vision-to-Text-Struktur neu formatiert wurden. Der Datensatz stellt eine Vielzahl von Aufgaben aus klassischen Vision-Language-Aufgaben zusammen, darunter Untertitelung, visuelle Frage- und Antwortfunktion (VQA), visuelle bedingte Generierung, Argumentation und Klassifizierung.

Direkte Verwendung:

https://hyper.ai/datasets/29048

5. ChatHaruhi-RolePlaying Rollenspiel-Dialogdatensatz

ChatHaruhi ist ein Datensatz mit 32 chinesischen/englischen TV-/Anime-Charakteren und über 54.000 simulierten Dialogen. Mit großen Sprachmodellen erstellte Rollenspiel-Chatbots haben große Aufmerksamkeit erregt. Um bestimmte fiktive Charaktere zu imitieren, schlug das Forschungsteam einen Algorithmus zur Steuerung des Sprachmodells durch verbesserte Eingabeaufforderungen und das Speichern von aus Skripten extrahierten Charakteren vor. Durch das Sammeln von Korpussen aus Filmen, Romanen und Drehbüchern und die Durchführung einer strukturierten Extraktion sammelte das Forschungsteam mehr als 23.000 Gesprächsnachrichten.

Direkte Verwendung:

https://hyper.ai/datasets/28926

Weitere aktualisierte Datensätze dieser Woche finden Sie unter:

https://hyper.ai/datasets

WissenschaftKI  ArgumentAusgewählte Fallstudien

1. 8-mal schneller als die beste Technologie: Hou Tingjun et al. von der Zhejiang-Universität schlug ResGen vor, ein 3D-Molekülgenerationsmodell basierend auf Proteintaschen

Zhejiang-Universität undZhijiang-LaborDas Forschungsteam schlug ein 3D-Modell zur Molekülgenerierung auf der Grundlage von Proteintaschen vor – ResGen, das 8-mal schneller ist als die bisher beste Technologie und erfolgreich medikamentenähnliche Moleküle mit geringerer Bindungsenergie und höherer Diversität erzeugt. Der Artikel wurde in der Zeitschrift Nature veröffentlicht.

Den vollständigen Bericht ansehen:

https://hyper.ai/news/29026

2. Luo Xiaozhous Team von der Chinesischen Akademie der Wissenschaften schlug das UniKP-Framework vor, ein großes Modell + maschinelles Lernen zur hochpräzisen Vorhersage enzymkinetischer Parameter

Das Team von Luo Xiaozhou vom Shenzhen Institute of Advanced Technology der Chinesischen Akademie der Wissenschaften schlug ein Rahmenwerk zur Vorhersage enzymkinetischer Parameter (UniKP) vor, um die Vorhersage einer Vielzahl verschiedener enzymkinetischer Parameter zu erreichen. Der Artikel wurde in der Zeitschrift Nature veröffentlicht.

Den vollständigen Bericht ansehen:

https://hyper.ai/news/29000

Beliebte Enzyklopädieartikel

1. Sigmoidfunktion

2. Markov-Kette (Markov-Kette)

3. Stichwort Angriff (Sofortige Injektion)

4. Belohnungsmodell

5. Prompt Engineering

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://hyper.ai/wiki

Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!

Bis nächste Woche!

Über HyperAI

HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:

* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze

* Enthält über 300 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai/