HyperAI

Choix Hebdomadaires De L'éditeur | La Salle De Live AI 7×24h Est Là ! Utilisation En Un Clic Du Nouveau Didacticiel De Clonage Vocal GPT-SoVITS

特色图像

📢📢 Bonne nouvelle ! Bonnes nouvelles! 📺「Super Neuro TV」 est maintenant en ligne sur bilibili~

« Super Neuro TV » diffusera des cours pratiques et des conférences industrielles dans le domaine de l'IA « 24h/24 et 7j/7 ».Chaque semaine, nous publierons un aperçu du programme de la semaine prochaine à la fin de l’article !

Cliquez pour voir :http://live.bilibili.com/26483094

Chuchotement,Karpathy, un expert technique qui a quitté OpenAI il y a quelque temps Le cours d'IA « Construisons un tokenizer GPT » sera diffusé dans la salle de diffusion en direct à 20 heures vendredi prochain (15 mars).Afin de permettre à chacun de découvrir plus facilement le projet, les ressources liées au projet minbpe ont également été lancées sur le site officiel hyper.ai. Venez regarder et apprendre~

De plus, cette semaine, le site Web officiel hyper.ai a lancé plusieurs ensembles de données d’analyse de sentiments textuels que tout le monde peut télécharger et utiliser !

Du 4 au 8 mars, le site officiel de hyper.ai a été mis à jour rapidement :

* Ensembles de données publiques de haute qualité : 10

* Sélection d'articles communautaires : 4 articles

* Entrées d'encyclopédie populaire : 10

Visitez le site officiel :hyper.ai

Ensembles de données publiques sélectionnés

1. référentiel minbpe

Ce référentiel est le référentiel du projet minbpe de Karpathy, qui contient des implémentations de Tokenizer basées sur des classes telles que BaseTokenizer et BasicTokenizer. Ces classes sont conçues pour fournir des fonctionnalités de base pour la formation, l'encodage et le décodage, ainsi que des fonctions utilitaires telles que la sauvegarde et le chargement.

Utilisation directe :

https://reurl.cc/97A8QY

2. Ensemble de données de dialogue chinois D4 pour le diagnostic de la dépression

D4 est un ensemble de données de dialogue chinois pour les chats de diagnostic de dépression. Il s’agit d’un nouveau type de conversation appelé chat basé sur les tâches. L'ensemble de données comprend 1 339 dialogues multi-tours, y compris des résumés de dialogue et des résultats de diagnostic.

Utilisation directe :

https://reurl.cc/krbAk3

3. Ensemble de données de critiques de films dmsc_v2

L'ensemble de données contient plus de 2 millions d'évaluations ou de critiques de 28 films par plus de 700 000 utilisateurs. Convient aux systèmes de recommandation, à l'analyse des sentiments/opinions/commentaires et à d'autres tâches d'analyse des tendances.

Utilisation directe :

https://reurl.cc/prbEOl

4. Amazon Ensemble de données d'avis des utilisateurs d'Amazon

L'ensemble de données contient 7,2 millions d'avis ou d'évaluations de 1,42 million d'utilisateurs sur 520 000 produits dans plus de 1 100 catégories sur Amazon, et peut être utilisé pour des tâches telles que les systèmes de recommandation et l'analyse des tendances des sentiments/opinions/avis.

Utilisation directe :

https://reurl.cc/97A8AV

5. Ensemble de données Dianping Dianping

L'ensemble de données contient 4,4 millions d'avis ou d'évaluations de 540 000 utilisateurs sur 240 000 restaurants. Il peut être utilisé pour des tâches telles que les systèmes de recommandation, l'analyse des tendances des sentiments/opinions/commentaires, etc.

Utilisation directe :

https://reurl.cc/eLbYrR

6. Ensemble de données du microblog sur les sentiments Weibo_senti_100k Sina

L'ensemble de données contient plus de 100 000 publications Sina Weibo avec des annotations de sentiment, dont environ 50 000 commentaires positifs et négatifs.

Utilisation directe :

https://reurl.cc/N487a6

7. Online_shopping_10_cats 10 catégories d'ensemble de données d'évaluation des achats en ligne

L'ensemble de données contient des avis d'achats en ligne dans 10 catégories (livres, tablettes, téléphones portables, fruits, shampoing, chauffe-eau, Mengniu, vêtements, ordinateurs et hôtels), avec un total de plus de 60 000 données d'avis, dont environ 30 000 avis positifs et négatifs. Il peut être utilisé pour des tâches d’analyse de sentiments/opinions/commentaires.

Utilisation directe :

https://reurl.cc/qrbl8g

8. Ensemble de données d'évaluation des hôtels ChnSentiCorp Ctrip

L'ensemble de données contient plus de 7 000 données d'avis d'hôtels provenant de Ctrip.com, dont plus de 5 000 avis positifs et plus de 2 000 avis négatifs.

Utilisation directe :

https://reurl.cc/QelvjM

9. Ensemble de données d'évaluation des utilisateurs de la plateforme de livraison de repas Waimai_10k

Cet ensemble de données provient des avis d'utilisateurs collectés par une plateforme de livraison de nourriture, dont environ 4 000 avis positifs et environ 8 000 avis négatifs. Peut être utilisé pour l'analyse des tendances des sentiments/opinions/commentaires.

Utilisation directe :

https://reurl.cc/K4zaQq

10. Quatre formes Ensemble de données à quatre formes

L'ensemble de données contient 16 000 images de 4 formes : carré, étoile, cercle et triangle. Chaque image mesure 200 × 200 pixels. Les données ont été collectées à l’aide d’une caméra d’action Garmin Virb 1080p.

Utilisation directe :

https://reurl.cc/E4N9Zm

Pour des ensembles de données plus mis à jour cette semaine, veuillez visiter:

https://hyper.ai/datasets

Articles de la communauté

1. Le taux de précision est de 91,74% ! L'Université du Sud-Est propose un modèle de détection des défauts des cellules photovoltaïques, introduisant pour la première fois la recherche de structures neuronales

Afin de répondre simultanément aux exigences du domaine industriel en matière de précision et de rapidité de détection des défauts, l'équipe du professeur Zhang Jinxia de l'École d'automatisation de l'Université du Sud-Est a proposé un modèle de détection automatique des défauts pour les images électroluminescentes des cellules photovoltaïques basé sur la recherche de structures neuronales et la distillation des connaissances, avec un taux de précision de 91,74%. Actuellement, les résultats de la recherche ont été publiés sur arXiv.

Voir le rapport complet :

https://reurl.cc/97AK7x

2. Tutoriel inclus : Modèle de clonage vocal GPT-SoVITS, 5 secondes de parole peuvent cloner une voix avec une similarité de 95%

Le fondateur de RVC (Retrieval based Voice Conversion) (compte GitHub : RVC-Boss) a ouvert le code source d'un projet de clonage vocal GPT-SoVITS, qui a gagné en popularité après son lancement. En fournissant seulement un échantillon de voix de 5 secondes, vous pouvez obtenir une voix clonée avec une similarité de 80%~95%. Actuellement, le didacticiel de déploiement du modèle a été lancé sur le site officiel de HyperAI.

Cliquez pour démarrer le clonage :

https://reurl.cc/97AKj8

3. Au cours des deux sessions, les leaders technologiques ont mentionné l'IA4S/la formation des talents/la puissance de calcul/les grands modèles/les ensembles de données générales de l'industrie...

C'est à nouveau l'heure des « Deux Sessions » ! Le rapport de travail du gouvernement a clairement proposé de lancer l'action « Intelligence artificielle + », et les députés de l'APN et les membres de la CCPPC de tous horizons ont également fait des suggestions sur l'IA. Cet article trie les propositions et suggestions de quelques grands noms du monde technologique.

Voir le rapport complet :

https://reurl.cc/lgbxGE

4. HyperAI Super Neural x DT Nouveaux Matériaux - Application de la technologie de l'IA dans la recherche en chimie et en science des matériaux - Ouverture des inscriptions

Le « Séminaire sur l'application de l'IA à la recherche en chimie et en science des matériaux » se tiendra à Zhengzhou, dans le Henan, du 23 au 25 avril. De nombreux experts du secteur partageront leurs points de vue approfondis sur les défis, les perspectives et les opportunités de l'application de l'IA dans le domaine de la chimie des matériaux.

Les développeurs intéressés peuvent cliquer sur le lien ci-dessous pour s'inscrire.

Lien d'inscription :

https://reurl.cc/QelMdb

Articles populaires de l'encyclopédie

1. Laplacien

2. Modélisation du monde

3. Images par seconde (FPS)

4. Modèle de diffusion

5. Intervention humaine dans la boucle (HITL)

Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :

https://hyper.ai/wiki

Aperçu de la diffusion en direct de Super Neuro B Station

datetempscontenu
11 mars
Lundi
10:00Les conférences de presse de NVIDIA au fil des ans
Mardi 12 mars10:0018:00Cours de compilation sur l'apprentissage automatique Journée de l'IA Tesla
Mercredi 13 mars10:00Conférences Google IO au fil des ans
Jeudi 14 mars10:00Symposium HAI de Stanford
Vendredi 15 mars10:0020:00Cours d'apprentissage en profondeur du MIT Construisons un tokeniseur GPT
Samedi 16 mars10:00Cours CS50 de Harvard (2023)
Dimanche 17 mars10:00Cours Harvard CS50 (2022)

Super Neuro TV diffuse en direct 24h/24 et 7j/7. Cliquez pour obtenir les « cornichons électroniques » dans le domaine de l'IA :

http://live.bilibili.com/26483094

Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !

À la semaine prochaine !

À propos d'HyperAI

HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :

* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques

* Comprend plus de 300 tutoriels en ligne classiques et populaires

* Interprétation de plus de 100 cas d'articles AI4Science

* Prise en charge de plus de 500 termes de recherche associés

* Hébergement de la première documentation complète d'Apache TVM en Chine

Visitez le site Web officiel pour commencer votre parcours d'apprentissage :

https://hyper.ai/