Choix Hebdomadaires De L'éditeur | La Salle De Live AI 7×24h Est Là ! Utilisation En Un Clic Du Nouveau Didacticiel De Clonage Vocal GPT-SoVITS

📢📢 Bonne nouvelle ! Bonnes nouvelles! 📺「Super Neuro TV」 est maintenant en ligne sur bilibili~
« Super Neuro TV » diffusera des cours pratiques et des conférences industrielles dans le domaine de l'IA « 24h/24 et 7j/7 ».Chaque semaine, nous publierons un aperçu du programme de la semaine prochaine à la fin de l’article !
Cliquez pour voir :http://live.bilibili.com/26483094
Chuchotement,Karpathy, un expert technique qui a quitté OpenAI il y a quelque temps Le cours d'IA « Construisons un tokenizer GPT » sera diffusé dans la salle de diffusion en direct à 20 heures vendredi prochain (15 mars).Afin de permettre à chacun de découvrir plus facilement le projet, les ressources liées au projet minbpe ont également été lancées sur le site officiel hyper.ai. Venez regarder et apprendre~
De plus, cette semaine, le site Web officiel hyper.ai a lancé plusieurs ensembles de données d’analyse de sentiments textuels que tout le monde peut télécharger et utiliser !
Du 4 au 8 mars, le site officiel de hyper.ai a été mis à jour rapidement :
* Ensembles de données publiques de haute qualité : 10
* Sélection d'articles communautaires : 4 articles
* Entrées d'encyclopédie populaire : 10
Visitez le site officiel :hyper.ai
Ensembles de données publiques sélectionnés
1. référentiel minbpe
Ce référentiel est le référentiel du projet minbpe de Karpathy, qui contient des implémentations de Tokenizer basées sur des classes telles que BaseTokenizer et BasicTokenizer. Ces classes sont conçues pour fournir des fonctionnalités de base pour la formation, l'encodage et le décodage, ainsi que des fonctions utilitaires telles que la sauvegarde et le chargement.
Utilisation directe :
2. Ensemble de données de dialogue chinois D4 pour le diagnostic de la dépression
D4 est un ensemble de données de dialogue chinois pour les chats de diagnostic de dépression. Il s’agit d’un nouveau type de conversation appelé chat basé sur les tâches. L'ensemble de données comprend 1 339 dialogues multi-tours, y compris des résumés de dialogue et des résultats de diagnostic.
Utilisation directe :
3. Ensemble de données de critiques de films dmsc_v2
L'ensemble de données contient plus de 2 millions d'évaluations ou de critiques de 28 films par plus de 700 000 utilisateurs. Convient aux systèmes de recommandation, à l'analyse des sentiments/opinions/commentaires et à d'autres tâches d'analyse des tendances.
Utilisation directe :
4. Amazon Ensemble de données d'avis des utilisateurs d'Amazon
L'ensemble de données contient 7,2 millions d'avis ou d'évaluations de 1,42 million d'utilisateurs sur 520 000 produits dans plus de 1 100 catégories sur Amazon, et peut être utilisé pour des tâches telles que les systèmes de recommandation et l'analyse des tendances des sentiments/opinions/avis.
Utilisation directe :
5. Ensemble de données Dianping Dianping
L'ensemble de données contient 4,4 millions d'avis ou d'évaluations de 540 000 utilisateurs sur 240 000 restaurants. Il peut être utilisé pour des tâches telles que les systèmes de recommandation, l'analyse des tendances des sentiments/opinions/commentaires, etc.
Utilisation directe :
6. Ensemble de données du microblog sur les sentiments Weibo_senti_100k Sina
L'ensemble de données contient plus de 100 000 publications Sina Weibo avec des annotations de sentiment, dont environ 50 000 commentaires positifs et négatifs.
Utilisation directe :
7. Online_shopping_10_cats 10 catégories d'ensemble de données d'évaluation des achats en ligne
L'ensemble de données contient des avis d'achats en ligne dans 10 catégories (livres, tablettes, téléphones portables, fruits, shampoing, chauffe-eau, Mengniu, vêtements, ordinateurs et hôtels), avec un total de plus de 60 000 données d'avis, dont environ 30 000 avis positifs et négatifs. Il peut être utilisé pour des tâches d’analyse de sentiments/opinions/commentaires.
Utilisation directe :
8. Ensemble de données d'évaluation des hôtels ChnSentiCorp Ctrip
L'ensemble de données contient plus de 7 000 données d'avis d'hôtels provenant de Ctrip.com, dont plus de 5 000 avis positifs et plus de 2 000 avis négatifs.
Utilisation directe :
9. Ensemble de données d'évaluation des utilisateurs de la plateforme de livraison de repas Waimai_10k
Cet ensemble de données provient des avis d'utilisateurs collectés par une plateforme de livraison de nourriture, dont environ 4 000 avis positifs et environ 8 000 avis négatifs. Peut être utilisé pour l'analyse des tendances des sentiments/opinions/commentaires.
Utilisation directe :
10. Quatre formes Ensemble de données à quatre formes
L'ensemble de données contient 16 000 images de 4 formes : carré, étoile, cercle et triangle. Chaque image mesure 200 × 200 pixels. Les données ont été collectées à l’aide d’une caméra d’action Garmin Virb 1080p.
Utilisation directe :
Pour des ensembles de données plus mis à jour cette semaine, veuillez visiter:
Articles de la communauté
Afin de répondre simultanément aux exigences du domaine industriel en matière de précision et de rapidité de détection des défauts, l'équipe du professeur Zhang Jinxia de l'École d'automatisation de l'Université du Sud-Est a proposé un modèle de détection automatique des défauts pour les images électroluminescentes des cellules photovoltaïques basé sur la recherche de structures neuronales et la distillation des connaissances, avec un taux de précision de 91,74%. Actuellement, les résultats de la recherche ont été publiés sur arXiv.
Voir le rapport complet :
Le fondateur de RVC (Retrieval based Voice Conversion) (compte GitHub : RVC-Boss) a ouvert le code source d'un projet de clonage vocal GPT-SoVITS, qui a gagné en popularité après son lancement. En fournissant seulement un échantillon de voix de 5 secondes, vous pouvez obtenir une voix clonée avec une similarité de 80%~95%. Actuellement, le didacticiel de déploiement du modèle a été lancé sur le site officiel de HyperAI.
Cliquez pour démarrer le clonage :
C'est à nouveau l'heure des « Deux Sessions » ! Le rapport de travail du gouvernement a clairement proposé de lancer l'action « Intelligence artificielle + », et les députés de l'APN et les membres de la CCPPC de tous horizons ont également fait des suggestions sur l'IA. Cet article trie les propositions et suggestions de quelques grands noms du monde technologique.
Voir le rapport complet :
Le « Séminaire sur l'application de l'IA à la recherche en chimie et en science des matériaux » se tiendra à Zhengzhou, dans le Henan, du 23 au 25 avril. De nombreux experts du secteur partageront leurs points de vue approfondis sur les défis, les perspectives et les opportunités de l'application de l'IA dans le domaine de la chimie des matériaux.
Les développeurs intéressés peuvent cliquer sur le lien ci-dessous pour s'inscrire.
Lien d'inscription :
Articles populaires de l'encyclopédie
1. Laplacien
2. Modélisation du monde
3. Images par seconde (FPS)
4. Modèle de diffusion
5. Intervention humaine dans la boucle (HITL)
Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :
Aperçu de la diffusion en direct de Super Neuro B Station
date | temps | contenu |
11 mars Lundi | 10:00 | Les conférences de presse de NVIDIA au fil des ans |
Mardi 12 mars | 10:0018:00 | Cours de compilation sur l'apprentissage automatique Journée de l'IA Tesla |
Mercredi 13 mars | 10:00 | Conférences Google IO au fil des ans |
Jeudi 14 mars | 10:00 | Symposium HAI de Stanford |
Vendredi 15 mars | 10:0020:00 | Cours d'apprentissage en profondeur du MIT Construisons un tokeniseur GPT |
Samedi 16 mars | 10:00 | Cours CS50 de Harvard (2023) |
Dimanche 17 mars | 10:00 | Cours Harvard CS50 (2022) |
Super Neuro TV diffuse en direct 24h/24 et 7j/7. Cliquez pour obtenir les « cornichons électroniques » dans le domaine de l'IA :
http://live.bilibili.com/26483094
Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !
À la semaine prochaine !
À propos d'HyperAI
HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :
* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques
* Comprend plus de 300 tutoriels en ligne classiques et populaires
* Interprétation de plus de 100 cas d'articles AI4Science
* Prise en charge de plus de 500 termes de recherche associés
* Hébergement de la première documentation complète d'Apache TVM en Chine
Visitez le site Web officiel pour commencer votre parcours d'apprentissage :