Choix Hebdomadaires De L'éditeur | Lancement De L'ensemble De Données Médicales RJUA-QA, Analyse Du Document ResGen Sur Le Modèle De Génération Moléculaire 3D

La nouvelle chronique d'HyperAI est ici~Chaque lundi, le département éditorial d'HyperNeural sélectionnera le contenu (ensembles de données, cas papier AI4S, entrées d'encyclopédie) mis à jour sur le site officiel hyper.ai la semaine précédente et les publiera ici. Bienvenue pour visiter hyper.ai directement pour voir tout le contenu !
Du 15 au 21 janvier, le site officiel de hyper.ai a été mis à jour rapidement :
* Ensembles de données publiques de haute qualité : 10
* Étuis en papier AI4S : 2
* Entrées d'encyclopédie populaire : 10
Visitez le site officiel :https://hyper.ai/
Ensembles de données publiques sélectionnés
1. CrossDock2020 :ResGen Ensembles de données traités pour la recherche
L’ensemble de données initial contient plus de 22 millions de paires protéine-ligand. Cet ensemble de données peut être utilisé pour les études d'interaction entre protéines et petites molécules, en particulier pour évaluer la capacité de liaison des molécules aux poches de protéines.
Utilisation directe :
https://hyper.ai/datasets/29021
2. RJUA-QA : le premier ensemble de données de raisonnement par questions-réponses sur les spécialités médicales chinoises
RJUA-QA est un ensemble de données de raisonnement innovant de type questions-réponses pour la spécialité d'urologie médicale. L'ensemble de données a été créé par l'équipe Ant Group Medical LLM en collaboration avec une équipe d'experts en urologie de l'hôpital Renji affilié à la faculté de médecine de l'université Jiao Tong de Shanghai. L'ensemble de données a été développé pour convertir les données cliniques réelles des patients en conversations cliniques virtuelles avec les patients, présentées au format Q-contexte-A (Question-Contexte-Réponse).
Utilisation directe :
https://hyper.ai/datasets/28970
3. Ensemble de données de raisonnement mathématique MetaMathQA
Afin d'améliorer les capacités de raisonnement direct et inverse du modèle, des chercheurs de Cambridge, de l'Université des sciences et technologies de Hong Kong et de Huawei ont proposé l'ensemble de données MetaMathQA basé sur deux ensembles de données mathématiques couramment utilisés (GSM8K et MATH) : un ensemble de données de raisonnement mathématique avec une large couverture et une haute qualité. MetaMathQA se compose de 395 000 paires de questions-réponses mathématiques avant-arrière générées par un grand modèle de langage.
Utilisation directe :
https://hyper.ai/datasets/28954
4. Ensemble de données de réglage d'instructions multi-modes et multi-langues M³IT
L'ensemble de données comprend 40 ensembles de données avec 2,4 millions d'instances et 400 instructions de tâches écrites manuellement, reformatées dans une structure vision-texte. L'ensemble de données compile une variété de tâches issues de tâches classiques de langage visuel, notamment le sous-titrage, la réponse visuelle aux questions (VQA), la génération conditionnelle visuelle, le raisonnement et la classification.
Utilisation directe :
https://hyper.ai/datasets/29048
5. Ensemble de données de dialogue de jeu de rôle ChatHaruhi-RolePlaying
ChatHaruhi est un ensemble de données contenant 32 personnages de télévision/anime chinois/anglais et plus de 54 000 dialogues simulés. Les chatbots de jeu de rôle construits avec de grands modèles de langage ont attiré une attention généralisée. Afin d’imiter des personnages fictifs spécifiques, l’équipe de recherche a proposé un algorithme pour contrôler le modèle de langage grâce à des invites améliorées et à la mémoire des caractères extraits des scripts. En collectant des corpus de films, de romans et de scénarios et en effectuant une extraction structurée, l’équipe de recherche a recueilli plus de 23 000 messages de conversation.
Utilisation directe :
https://hyper.ai/datasets/28926
Pour des ensembles de données plus mis à jour cette semaine, veuillez visiter :
ScienceAI ArgumentÉtudes de cas sélectionnées
Université du Zhejiang etLaboratoire ZhijiangL'équipe de recherche a proposé un modèle de génération moléculaire 3D basé sur des poches de protéines - ResGen, qui est 8 fois plus rapide que la meilleure technologie précédente et a généré avec succès des molécules de type médicament avec une énergie de liaison plus faible et une diversité plus élevée. L’article a été publié dans la revue Nature.
Voir le rapport complet :
L'équipe de Luo Xiaozhou de l'Institut de technologie avancée de Shenzhen, Académie chinoise des sciences, a proposé un cadre de prédiction des paramètres cinétiques enzymatiques (UniKP) pour parvenir à la prédiction d'une variété de paramètres cinétiques enzymatiques différents. L’article a été publié dans la revue Nature.
Voir le rapport complet :
Articles populaires de l'encyclopédie
1. Fonction sigmoïde
2. Chaîne de Markov (chaîne de Markov)
3. Attaque par mot clé (Injection rapide)
4. Modèle de récompense
5. Ingénierie rapide
Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :
Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous aimeriez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !
À la semaine prochaine !
À propos d'HyperAI
HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :
* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques
* Comprend plus de 300 tutoriels en ligne classiques et populaires
* Interprétation de plus de 100 cas d'articles AI4Science
* Prise en charge de plus de 500 termes de recherche associés
* Hébergement de la première documentation complète d'Apache TVM en Chine
Visitez le site Web officiel pour commencer votre parcours d'apprentissage :