Tencent Lance PhotoMaker, Un Nouveau Niveau De Génération D’images Personnalisées ; LawInstruct, Le Premier Ensemble De Données D'instructions Juridiques À Grande Échelle, Est Lancé

PhotoMaker est un outil de génération d'images IA développé conjointement par Tencent et l'Université Nankai. Il peut non seulement capturer les traits du visage des personnes, mais également générer des images réalistes des personnes en fonction de leurs préférences, poussant la personnalisation personnalisée à un nouveau niveau. Que vous souhaitiez un tout nouvel avatar pour les réseaux sociaux ou que vous souhaitiez concevoir un personnage unique pour votre jeu, nous pouvons vous satisfaire.
Le didacticiel de démonstration d'exécution en un clic de ce projet est désormais disponible sur le site officiel d'hyper.aiAfin de permettre à chacun de découvrir le modèle plus facilement et plus rapidement, la version du workflow ComfyUI est également lancée, qui a une vitesse de génération plus rapide ! Plus de formulaires personnalisés disponibles ! Venez en faire l'expérience~
Du 17 au 21 juin, le site officiel hyper.ai est mis à jour :
* Ensembles de données publiques de haute qualité : 10
* Tutoriels sélectionnés de haute qualité : 2
* Sélection d'articles communautaires : 4 articles
* Entrées d'encyclopédie populaire : 5
* Principales conférences avec dates limites en juin et juillet : 5
Visitez le site officiel :hyper.ai
Ensembles de données publiques sélectionnés
1. Ensemble de données d'images biologiques TreeOfLife-10M
Avec plus de 10 millions d'images couvrant 454 000 taxons à travers l'arbre de la vie, cet ensemble de données est le plus grand ensemble de données ML d'images d'organismes biologiques et de leurs étiquettes taxonomiques associées à ce jour. Le document de recherche est le meilleur document du CVPR 2024.
Utilisation directe :https://go.hyper.ai/jimyx
2. Ensemble de données de reconnaissance de l'action humaine HAR 15
L'ensemble de données est une base contenant 15 catégories différentes d'activités humaines, environ 12 000 images étiquetées (y compris les images de vérification), chaque image n'a qu'une seule catégorie d'activité humaine et vise à comprendre le comportement humain et à attribuer des étiquettes à chaque action.
Utilisation directe :https://go.hyper.ai/3jmf1
3. Ensemble de données d'articles originaux Linux China
Cet ensemble de données est un ensemble de données d'articles techniques originaux de Linux China + d'articles techniques traduits, fournissant plusieurs champs tels que le titre et le contenu de l'article.
Utilisation directe :https://go.hyper.ai/KgFgf
4. DroneVehicle Ensemble de données de détection de véhicules aériens par drone à grande échelle
L'ensemble de données comprend un total de 56 878 images collectées par des drones, dont la moitié sont des images RVB et le reste sont des images infrarouges. Cet ensemble de données fournit un support pour la gestion intelligente du trafic urbain et les secours en cas de catastrophe.
Utilisation directe :https://go.hyper.ai/KhbuB
5. Ensemble de données de génération de mouvements de piano PianoMotion10M
Cet ensemble de données est un ensemble de données de référence axé sur la génération de gestes de jeu de piano, couvrant 116 heures de vidéos de jeu de piano filmées à vol d'oiseau et contenant 10 millions de poses de mains annotées. Ces données fournissent une ressource riche pour explorer l’association entre la musique pour piano et les mouvements des mains.
Utilisation directe :https://go.hyper.ai/QAOi8
6. LawInstruct : le premier ensemble de données d'instructions juridiques à grande échelle
Cet ensemble de données est le premier ensemble de données d'instructions à grande échelle pour le domaine juridique, couvrant 17 juridictions et 24 langues, contenant 12 millions d'exemples de formation et couvrant une variété de tâches juridiques telles que la réponse aux questions, l'implication, le résumé et l'extraction d'informations.
Utilisation directe :https://go.hyper.ai/ARN3n
7. Ensemble de données de la langue des signes ASL
L'ensemble de données contient des images de lettres de la langue des signes américaine, qui sont divisées en 29 catégories, représentant différentes lettres et symboles de la langue des signes. La taille de l’image dans l’ensemble de données est uniformément de 200 × 200 pixels et l’ensemble de données d’entraînement contient 87 000 images.
Utilisation directe :https://go.hyper.ai/IhhZc
8. Ensemble de données de lettres manuscrites AZ au format .csv
Cet ensemble de données est une collection à grande échelle d'images de lettres manuscrites en anglais, conçues spécifiquement pour les tâches de reconnaissance de l'écriture manuscrite et pouvant être utilisées pour former divers modèles de reconnaissance d'images.
Utilisation directe :https://go.hyper.ai/28lwk
9. Ensemble de données CAT Ensemble de données d'images d'annotation des traits du visage du chat
L'ensemble de données contient plus de 9 000 images de chats annotées avec des traits du visage. Chaque image est annotée avec une tête de chat, qui comporte 9 points : 1 pour la bouche, 2 pour les yeux et 6 pour les oreilles.
Utilisation directe :https://go.hyper.ai/MkmTu
L'ensemble de données contient des centaines de fichiers audio des catégories chats et chiens : 164 fichiers WAV pour les chats, correspondant à 1 323 secondes d'audio ; et 113 fichiers WAV pour chiens, correspondant à 598 secondes d'audio. Tous les fichiers « wav » contiennent de l'audio à 16 kHz et sont de longueur variable.
Utilisation directe :https://go.hyper.ai/e0RGg
Pour plus d'ensembles de données publics, veuillez visiter :
Tutoriels publics sélectionnés
1. Démonstration de génération d'images stylisées arbitraires dans PhotoMaker
PhotoMaker est un modèle de portrait personnalisé efficace qui peut générer rapidement des photos de portrait personnalisées et des photos artistiques basées sur des photos de portrait. En plus de générer des portraits personnalisés, il peut également modifier l'âge et le sexe d'une personne et intégrer les caractéristiques de différentes personnes pour créer de nouvelles informations sur une personne. C'est un outil de peinture IA très utile. Ce tutoriel a configuré l'environnement pour votre commodité.
Exécutez en ligne :https://go.hyper.ai/3B5Rd
2. Flux de travail de génération d'images ComfyUI PhotoMaker ZHO
Ce tutoriel explique comment exécuter le flux de travail ComfyUI dans PhotoMaker. Par rapport à la version Gradio de la démo, la version du workflow ComfyUI présente les avantages d'une génération plus rapide, de la prise en charge du fractionnement des nœuds et de la taille personnalisée, etc. Chao Neural Network a créé l'environnement approprié pour vous, et vous pouvez l'exécuter en le clonant en un clic.
Exécutez en ligne :https://go.hyper.ai/XdSoQ
3. Classification des styles de chansons basée sur HuBERT
Ce didacticiel utilise le modèle de base HuBERT pour démontrer comment utiliser un modèle audio pré-entraîné pour effectuer des tâches de classification audio et implémente la classification des styles musicaux en affinant le modèle pré-entraîné.
Exécutez en ligne :https://go.hyper.ai/7QjRj
Nous avons également créé un groupe d'échange de tutoriels Stable Diffusion. Bienvenue aux amis pour scanner le code QR et commenter [tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application ~

Articles de la communauté
HyperAI organisera le 5e rassemblement hors ligne du Meet AI Compiler Technology Salon à l'Institut de technologie informatique de l'Académie chinoise des sciences le 6 juillet (samedi). Cette rencontre est divisée en deux parties : partage de technologie et table ronde. Les invités viennent de l'Université Jiao Tong de Shanghai, de l'Institut de technologie informatique, de l'Académie chinoise des sciences, de Microsoft Research Asia et de l'Académie d'intelligence artificielle de Pékin. Nous espérons que ce nouveau rassemblement apportera de nouveaux gains technologiques à tous et permettra de se faire de nouveaux amis dans le même domaine.Cliquez sur « Lire le texte original » pour vous inscrire et participer !
Afficher les détails de l'événement :https://go.hyper.ai/oAsLQ
Le premier établissement d'enseignement et de recherche au monde construit autour de l'intersection de l'intelligence artificielle et de la finance - l'Institut d'intelligence artificielle et de finance de Shanghai de l'Université normale de Chine orientale - a été officiellement inauguré récemment. HyperAI a eu l'honneur d'avoir un entretien approfondi avec le doyen Shao Yile et de mieux comprendre la vision et le plan de développement du nouveau collège.
Lire l'interview complète :https://go.hyper.ai/bp4Po
Le professeur Wu Sijin de l'école de pharmacie Huihu de l'université Xi'an Jiaotong-Liverpool, en collaboration avec le professeur Xie Songbo et l'équipe du professeur Zhong Diansheng de l'hôpital général de l'université médicale de Tianjin, ont développé un dégradateur sélectif de p53-R175H - dp53m. Ce dégradateur peut reconnaître spécifiquement la protéine mutante p53-R175H et cibler sa dégradation, avec une efficacité antitumorale significative et aucune réaction toxique évidente. Le dp53m peut également améliorer la sensibilité des cellules cancéreuses au médicament de chimiothérapie cisplatine, qui est crucial pour le traitement du cancer. Cet article est une interprétation détaillée et un partage de la recherche.
Voir le rapport complet :https://go.hyper.ai/k80er
Des chercheurs du laboratoire SIG de l'Université du Zhejiang ont introduit une méthode de réseau neuronal pour coupler de manière non linéaire plusieurs mesures de proximité spatiale entre des points d'observation afin d'obtenir une mesure de proximité spatiale optimisée, ce qui a amélioré la précision des prédictions du modèle sur les prix des logements. L'étude a également combiné l'OSP avec la méthode de régression pondérée du réseau neuronal géographique pour construire le modèle osp-GNNWR, et a réalisé la formation du réseau neuronal en résolvant la relation de régression spatiale non stationnaire entre la variable dépendante et la variable indépendante. Cet article est une interprétation détaillée et un partage de la recherche.
Voir le rapport complet :https://go.hyper.ai/kWmHC
Articles populaires de l'encyclopédie
1. Appel de fonction Appel de fonction
2. Réseau neuronal à pics (SNN)
3. Codage de la position du contexte CoPE
4. Les poupées russes représentent l'apprentissage du MRL
5. Théorème de représentation de Kolmogorov-Arnold
Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :
Aperçu de la diffusion en direct de la station B
Jeff Dean est un chercheur senior et informaticien chez Google, connu pour son travail de pionnier dans les systèmes distribués et l'intelligence artificielle, notamment le développement de MapReduce et TensorFlow, et est l'une des figures clés du développement technologique de Google. Cette semaine, Super Neuro TV diffusera en direct les discours et interviews de Jeff Dean.
Le tableau suivant est un aperçu du contenu sélectionné par l'éditeur↓↓↓
date | temps | contenu |
Lundi 24 juin | 18:00 | Jeff Dean sur les cinq grandes tendances de l'apprentissage automatique |
Mardi 25 juin | 18:00 | Que l'IA serve tout le monde |
Mercredi 26 juin | 18:00 | La vision positive de Jeff Dean sur l'avenir de l'IA |
Jeudi 27 juin | 18:00 | Discours de Jeff Dean à la Stanford Medical Big Data Conference |
Vendredi 28 juin | 18:00 | Conférence de Jeff Dean sur l'apprentissage profond |
Samedi 29 juin | 18:00 | Résidence Google Brain & Brain |
Dimanche 20 juin | 18:00 | Comment utiliser l'apprentissage profond pour résoudre des problèmes |
Super Neuro TV diffuse en direct 24h/24 et 7j/7. Cliquez pour obtenir les « cornichons électroniques » dans le domaine de l'IA :
http://live.bilibili.com/26483094
Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !
À la semaine prochaine !
À propos d'HyperAI
HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :
* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 300 ensembles de données publiques
* Comprend plus de 400 tutoriels en ligne classiques et populaires
* Interprétation de plus de 100 cas d'articles AI4Science
* Prise en charge de plus de 500 termes de recherche associés
* Hébergement de la première documentation complète d'Apache TVM en Chine
Visitez le site Web officiel pour commencer votre parcours d'apprentissage :