HyperAI

Choix Hebdomadaires De L'éditeur | L'ensemble De Données COIG-CQIA Est En Ligne Et Le Flux De Travail ComfyUI Wenshengtu S'exécute En Ligne

特色图像

Afin de combler le manque d'ensembles de données chinois de haute qualité, 10 institutions, dont l'Académie chinoise des sciences, Zero One Everything et l'Université de Pékin, ont développé conjointement l'ensemble de données COIG-CQIA. Étonnamment,La qualité des données de « Retarded Post Bar » dans cet ensemble de données est bien supérieure à celle des communautés de connaissances telles que Zhihu, Douban et Sifou. L'ensemble de données COIG-CQIA est désormais disponible sur le site Web hyper.ai. Venez jeter un oeil !

Du 8 au 12 avril, le site officiel d'hyper.ai est mis à jour :

* Ensembles de données publiques de haute qualité : 10

* Tutoriels sélectionnés de haute qualité : 2

* Sélection d'articles communautaires : 5 articles

* Entrées d'encyclopédie populaire : 5

Visitez le site officiel :hyper.ai

Ensembles de données publiques sélectionnés

1. COIG-CQIA Ensemble de données de perfectionnement de l'enseignement du chinois de haute qualité

COIG-CQIA signifie Chinese Open Instruction Generalist – La qualité est tout ce dont vous avez besoin. Il s'agit d'un ensemble de données de réglage fin d'instructions open source de haute qualité qui vise à fournir à la communauté chinoise du PNL des données de réglage fin d'instructions de haute qualité conformes au comportement d'interaction humaine.

Utilisation directe :https://go.hyper.ai/Pg37L

2. Ensemble de données d'apprentissage des compétences multi-perspectives EgoExoLearn

L'ensemble de données EgoExoLearn contient 120 heures de données vidéo collectées à partir de scènes de la vie quotidienne et de laboratoires professionnels. Les vidéos de l'ensemble de données comprennent non seulement des vidéos de démonstration, mais également des vidéos enregistrées par l'interprète en utilisant sa propre perspective à la première personne (égocentrique) après avoir regardé la démonstration.

Utilisation directe :https://go.hyper.ai/cYsPM

3. Ensemble de données de simulation de perception collaborative du navire S2S-SIM

L'ensemble de données S2S-Sim est le premier ensemble de données de simulation de perception collaborative de navire développé par l'Université de Shanghai. L'ensemble de données contient un total de 7 000 images de données, avec 96 881 annotations précises des cadres de délimitation des navires. Son objectif est de soutenir une perception collaborative efficace entre les navires, avec un accent particulier sur la recherche dans le domaine de la perception collaborative entre les systèmes de conduite autonomes et les navires. 

Utilisation directe : https://go.hyper.ai/AVWp2

4. Ensemble de données du domaine public chinois Common Corpus-zh

Common Corpus a été créé conjointement par Pleias, HuggingFace et d'autres institutions. Il s’agit actuellement du plus grand ensemble de données du domaine public spécifiquement destiné à la formation de grands modèles linguistiques (LLM). L'ensemble de données rassemble 500 milliards de mots provenant de divers projets de patrimoine culturel du monde entier, notamment l'anglais, le français, le chinois, l'espagnol, l'allemand, l'italien et d'autres langues, ce qui en fait la bibliothèque de ressources linguistiques la plus complète à ce jour.

Utilisation directe : https://go.hyper.ai/hvuV5

5. TriviaQA Un grand ensemble de données pour la compréhension en lecture et la réponse aux questions

TriviaQA est un ensemble de données de compréhension de lecture contenant plus de 650 000 triplets de preuves questions-réponses. TriviaQA comprend 95 000 paires questions-réponses provenant de 662 000 documents de Wikipédia et du Web.

Utilisation directe : https://go.hyper.ai/aant8

6. Ensemble de données d'évaluation des hallucinations du grand modèle chinois HalluQA

L'ensemble de données HalluQA contient 450 questions contradictoires couvrant plusieurs domaines et impliquant l'histoire, la culture, les coutumes et les phénomènes sociaux chinois.

Utilisation directe : https://go.hyper.ai/pWyqe

7. Ensembles de données d'analyse et de prévision des inondations générés par des modèles d'IA

Cet ensemble de données est constitué des données de recherche de l'article « Prévision mondiale des inondations extrêmes dans les bassins versants non jaugés ». Le contenu principal est constitué des données de réanalyse des inondations (1984-2021) et de nouvelle prévision (2014-2021) générées par le modèle d'IA et les données de référence GloFAS correspondantes.

Utilisation directe : https://go.hyper.ai/bpsG3

8. Ensemble de données de scènes multimodales de grande taille MASSTAR

MASSTAR est un ensemble de données de scènes multimodales à grande échelle proposé conjointement par l'Université Sun Yat-sen, l'Université des sciences et technologies de Hong Kong et d'autres institutions. Il contient plus de 1 000 modèles de maillage 3D au niveau de la scène, dont certains proviennent du monde réel.

Utilisation directe :https://go.hyper.ai/eLZUy

9. Ensemble de données de reconnaissance d'action vidéo de badminton VideoBadminton

VideoBadminton est un ensemble de données vidéo de badminton de haute qualité créé par l'Université d'Auburn et l'Université nationale centrale. L'ensemble de données contient des données vidéo de badminton de 19 athlètes masculins et féminins de l'équipe de l'Université nationale centrale, couvrant 18 mouvements de badminton, un total de 7 822 clips vidéo et une durée totale de 145 minutes.

Utilisation directe :https://go.hyper.ai/w5ToD

10. FineFake : ensemble de données de détection de fausses nouvelles multi-domaines à granularité fine

FineFake est un ensemble de données pour la détection précise des fausses nouvelles multi-domaines, créé conjointement par l'Université Beihang et l'Université des postes et télécommunications de Pékin. L'ensemble de données contient un total de 16 909 échantillons de données, couvrant 6 sujets sémantiques et 8 plates-formes différentes. Chaque échantillon d’actualité contient plusieurs formes de contenu, notamment du texte, des images et des informations potentielles sur le contexte social.

Utilisation directe :https://go.hyper.ai/CNWIn

Pour plus d'ensembles de données publics, veuillez visiter:

https://hyper.ai/datasets

Tutoriels publics sélectionnés

1. Le coût peut être réduit jusqu’à 16 fois. Le tutoriel ComfyUI Stable Cascade est désormais en ligne et peut être déployé en un clic !

Ce tutoriel est un tutoriel sur l'utilisation du flux de travail ComfyUI Stable Casecade pour la peinture IA. Le didacticiel a mis en place un bon environnement et intégré le flux de travail d'image texte par défaut de Stable Cascade. Il connecte directement les nœuds pour simplifier le processus d'utilisation et peut produire une image en 2 secondes.

Exécutez en ligne :https://go.hyper.ai/lJGLF

2. Tutoriel sur la classification des images de maladies des cultures

Ce tutoriel concerne l'utilisation de PyTorch pour la classification des images de maladies des cultures, ce qui permet de former des modèles d'apprentissage automatique pour détecter les maladies des plantes ou développer un apprentissage automatique d'algorithmes de diagnostic des plantes.

Exécutez en ligne :https://go.hyper.ai/

Articles de la communauté

1. Une collection de ressources de modèles de très grande taille | 30 ensembles de données et modèles NLP de haute qualité, 8 démos pour une utilisation en un clic, recommandés pour la collecte !

Cet article résume les ressources liées aux grands modèles, dont 15 ensembles de données, 15 modèles et 8 démos de grands modèles, avec des liens de téléchargement et d'utilisation.

Voir l'article complet :https://go.hyper.ai/sYC6h

2. Identifier efficacement 630 000 configurations spatiales tridimensionnelles, l'Université Tsinghua a dirigé la publication du modèle Uni-MOF pour prédire la capacité d'adsorption MOF

L'équipe du professeur Lu Diannan du département de génie chimique de l'université Tsinghua a pris l'initiative de proposer un modèle d'apprentissage automatique Uni-MOF pour prédire le comportement d'adsorption des matériaux MOF tridimensionnels. Ce modèle peut non seulement identifier et restaurer la structure tridimensionnelle des matériaux nanoporeux grâce à une pré-formation, mais également prendre en compte davantage les conditions de fonctionnement telles que la température, la pression et différentes molécules de gaz. Il convient aussi bien à la recherche scientifique qu'aux applications pratiques. Les résultats pertinents ont été publiés dans la revue « Nature ».

Voir le rapport complet :https://go.hyper.ai/VWFVo

3. Le cancer de l’ovaire peut être identifié grâce à des analyses sanguines de routine, des analyses d’urine et d’autres indicateurs ! L'équipe de Liu Jihong de l'Université Sun Yat-sen a pris les devants et quatre grandes écoles de médecine ont conjointement construit un modèle de fusion d'IA

L'Université Sun Yat-sen, l'Université médicale du Sud, l'Université des sciences et technologies de Huazhong et l'Université du Zhejiang ont construit conjointement le modèle de fusion d'intelligence artificielle MCF pour le diagnostic du cancer de l'ovaire, qui peut calculer le risque de cancer de l'ovaire en saisissant des données de tests de laboratoire de routine et l'âge. La précision du modèle est meilleure que celle des biomarqueurs traditionnels tels que CA125 et HE4. Les résultats pertinents ont été publiés dans The Lancet Digital Health.

Voir le rapport complet :https://go.hyper.ai/prEbC

4. Aperçu d'Insilico : le saut, le dilemme et la percée de la société pharmaceutique star de l'IA

Insilicon Valley Silicon, qui a levé 407,5 millions de dollars, n'a pas réussi à s'introduire en bourse à Hong Kong en janvier de cette année et a soumis sa demande d'introduction en bourse pour la deuxième fois le 27 mars. Dans le contexte de la concurrence technologique entre la Chine et les États-Unis, la situation de l'entreprise, « start-up américaine, co-PDG chinois, actionnaires américains, siège social chinois... », a doublé sa pression. Il reste à voir comment sortir de l’impasse et si elle peut devenir avec succès la « première action pharmaceutique d’IA ». Cet article fournit une introduction approfondie à cette société pharmaceutique star de l'IA sous les aspects du développement technologique, de la composition de l'équipe et du développement commercial.

Voir le rapport complet :https://go.hyper.ai/llREq

Articles populaires de l'encyclopédie

1. Chaîne Lang

2. Modèle de mélange d'experts MoE

3. Attention aux requêtes de groupe GQA

4. Fusion de classement réciproque RRF

5. Taux de rappel

Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :

https://hyper.ai/wiki

Aperçu de la diffusion en direct de la station B

datetempscontenu
Lundi 15 avril10:00Conférences Google IO au fil des ans
Mardi 16 avril10:00Cours d'apprentissage profond du MIT 2020
Mercredi 17 avril10:00Cours d'apprentissage profond du MIT 2021
Jeudi 18 avril10:00Cours complet pour débutants sur le développement d'API Python
Vendredi 19 avril10:00Cours Flutter pour débutants
Samedi 20 avril10:00Cours d'intelligence artificielle Python Harvard CS50
Dimanche 21 avril10:00Symposium HAI de Stanford

Super Neuro TV diffuse en direct 24h/24 et 7j/7. Cliquez pour obtenir les « cornichons électroniques » dans le domaine de l'IA :

http://live.bilibili.com/26483094

Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !

À la semaine prochaine !

À propos d'HyperAI

HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :

* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques

* Comprend plus de 300 tutoriels en ligne classiques et populaires

* Interprétation de plus de 100 cas d'articles AI4Science

* Prise en charge de plus de 500 termes de recherche associés

* Hébergement de la première documentation complète d'Apache TVM en Chine

Visitez le site Web officiel pour commencer votre parcours d'apprentissage :

https://hyper.ai