Le Premier Grand Modèle Multimodal De Meta Est Lancé En Un Clic ! Le Premier Ensemble De Données De Broderie Multi-aiguilles Est En Ligne, Contenant Plus De 30 000 Images

Zuckerberg a annoncé le lancement du premier grand modèle multimodal Llama 3.2 dans son discours d'ouverture de Meta Connect 2024 ! Le modèle existe en deux versions, 11B et 90B, devenant ainsi les premiers modèles de la série Llama à prendre en charge les tâches multimodales. Selon les données officielles, les performances de ces deux modèles open source ont dépassé celles des modèles fermés.
J'ai hâte de le déployer.Nous avons immédiatement lancé un tutoriel de déploiement en un clic pour le modèle 11B sur le site officiel hyper.ai.Bienvenue à tous pour expérimenter le raisonnement ensemble~
Exécutez en ligne :https://go.hyper.ai/DKGzm
Du 23 au 27 septembre, le site officiel de hyper.ai a été mis à jour rapidement :
* Ensembles de données publiques de haute qualité : 10
* Tutoriels sélectionnés de haute qualité : 2
* Sélection d'articles communautaires : 3 articles
* Entrées d'encyclopédie populaire : 5
* Principales conférences avec date limite en octobre : 7
Visitez le site officiel :hyper.ai
Ensembles de données publiques sélectionnés
1. Ensemble de données de broderie multi-aiguilles MSEmbGAN
Cet ensemble de données est le premier ensemble de données de broderie annoté en détail avec des étiquettes à point unique et à points multiples. Plus de 30 000 images, y compris des images de broderie et des images de contenu correspondantes, ont été produites à l'aide d'un logiciel de broderie professionnel (Wilcom 9.0). Cet article apportera l’ensemble de données de broderie multi-aiguilles construit à d’autres chercheurs dans ce domaine de recherche.
Utilisation directe :https://go.hyper.ai/urNGE
2. L'ensemble de données sur les films Ensemble de données d'informations sur les films
Cet ensemble de données contient des métadonnées détaillées pour 45 000 films de l'ensemble de données complet MovieLens, tous sortis avant juillet 2017. Cet ensemble de données couvre non seulement les informations de base sur les films, telles que les affiches, les arrière-plans, les budgets et les revenus, mais comprend également des informations détaillées telles que la date de sortie, la langue, le pays de production et la société.
Utilisation directe :https://go.hyper.ai/SDwXX
3. Ouvrir le jeu de données du robot réel X-Embodiment
L'ensemble de données rassemble des données provenant de 22 types de robots différents, des robots à un bras aux robots à deux mains et aux robots quadrupèdes, collectées par 21 institutions différentes, couvrant 527 compétences différentes et 160 266 tâches. Il a été construit en rassemblant 60 ensembles de données robotiques existants provenant de 34 laboratoires de recherche en robotique du monde entier, présentant une variété de tâches et d'environnements robotiques.
Utilisation directe :https://go.hyper.ai/Cqlw6
4. Ensemble de données de films TMDB 5k Ensemble de données d'informations sur les films
Cet ensemble de données contient des informations détaillées sur 5 000 films, principalement des États-Unis au cours des 100 dernières années (1916-2017). L'ensemble de données est conçu pour aider les chercheurs et les analystes à explorer les tendances populaires et les orientations d'investissement dans l'industrie cinématographique, ainsi qu'à fournir des suggestions de référence aux nouveaux entrants dans l'industrie cinématographique.
Utilisation directe :https://go.hyper.ai/zaRFY
5. Ensemble de données d'amélioration à granularité fine du grand modèle LongCite-45k
L'ensemble de données contient 44 600 données de questions-réponses de haute qualité avec des citations au niveau des phrases, prend en charge le traitement de texte long avec une longueur maximale de 128 000 jetons et permet aux utilisateurs de vérifier l'exactitude des réponses du modèle en générant des citations au niveau des phrases à granularité fine.
Utilisation directe :https://go.hyper.ai/omO5f
6. Ensemble de données complet sur les films TMDB 2024
TMDb (The Movie Database) est une base de données de films complète. Cet ensemble de données contient une collection de 1 000 000 films de la base de données TMDB, fournissant des informations sur les films, notamment des détails tels que le titre, la note, la date de sortie, les revenus, le genre, etc.
Utilisation directe :https://go.hyper.ai/r9ks2
7. Ensemble de données de raisonnement mathématique multimodal InfiMM-WebMath-40B
Cet ensemble de données est un grand ensemble de données multimodal open source conçu spécifiquement pour les tâches de raisonnement mathématique, contenant 2,4 000 pages Web, 8,5 000 URL d'images associées et 40 milliards de jetons, qui ont tous été soigneusement extraits et filtrés de la base de données CommonCrawl (2019-2023).
Utilisation directe :https://go.hyper.ai/P8m9l
8. Ensemble de données d'optimisation de l'assistant vocal VoiceAssistant-400K
VoiceAssistant-400K est un ensemble de données optimisé pour les assistants vocaux. Son objectif est d'aider le modèle à réduire la génération de symboles de code lors de la fourniture de services d'assistant vocal et d'améliorer la praticité du modèle dans les applications réelles.
Utilisation directe :https://go.hyper.ai/KGIM0
9. Ensemble de données de critiques d'albums de musique des 5 000 meilleurs albums de tous les temps
Cet ensemble de données contient http://rateyourmusic.com Les albums 5k les plus populaires de tous les temps selon les votes des utilisateurs de la communauté. L'ensemble de données a été exploré le 12 octobre 2021 et comprend des attributs tels que le rang, le nom de l'album, le nom de l'artiste, la date de sortie, le genre, la description, la note moyenne, le nombre de notes et le nombre d'avis.
Utilisation directe :https://go.hyper.ai/c4Olt
L'ensemble de données contient les listes des 200 meilleures chansons de Spotify pour chaque jour dans le monde de 2017 à 2021. Cet ensemble de données couvre plus de 350 000 chansons, fournissant aux chercheurs et aux mélomanes des informations riches pour analyser les tendances de popularité, les préférences musicales et d'autres études connexes.
Utilisation directe :https://go.hyper.ai/afvbK
Pour plus d'ensembles de données publics, veuillez visiter :
Tutoriels publics sélectionnés
1. Déploiement en un clic de Llama-3.2-11B-Vision-Instruct
Le modèle est une taille de paramètre 11B de la famille de grands modèles multimodaux Llama 3.2-Vision, prend en charge l'entrée d'image haute résolution (1120 × 1120 pixels) et utilise un mécanisme d'attention croisé avec la variante de chat de l'achèvement du modèle de base et l'ajustement des instructions. Accédez au site Web officiel pour cloner et démarrer le conteneur, copiez directement l'adresse API, puis vous pourrez expérimenter l'inférence du modèle.
Utilisation directe :https://go.hyper.ai/DKGzm
2. Démo de génération d'illustrations de contes de fées ComfyUl Littletinies
Le modèle est capable de générer des images de style dessin animé dessinées à la main en fonction d'invites textuelles. Ce modèle est particulièrement adapté à la création d'illustrations fantaisistes et stylisées avec une esthétique de dessin animé classique, et les images qu'il génère ont une texture dessinée à la main, des coups de pinceau lisses et des couleurs douces. Le modèle et l’environnement ont été déployés et vous pouvez générer des inférences selon les instructions du didacticiel.
Utilisation directe :https://go.hyper.ai/YHu0a
Nous avons également créé un groupe d'échange de tutoriels Stable Diffusion. Bienvenue aux amis pour scanner le code QR et commenter [tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application ~

Articles de la communauté
Le groupe de recherche de Hu Xinrong de l'École d'informatique et d'intelligence artificielle de l'Université textile de Wuhan a proposé un modèle de réseau antagoniste génératif de broderie multi-points MSEmbGAN et a créé le plus grand ensemble de données de broderie actuel. L’article connexe a également été accepté par la revue de renom TVCG. Cet article est une interprétation et un partage détaillés du document.
Voir le résumé complet :https://go.hyper.ai/5t8NQ
L'équipe de Hong Liang de l'Université Jiao Tong de Shanghai a conçu un cadre de modèle de probabilité de diffusion capable d'apprendre la relation de mappage implicite entre la séquence, la structure et la fonction des protéines avec un coût de formation et un coût de données très faibles, générant ainsi diverses séquences de protéines. Cet article est une interprétation et un partage détaillés du document.
Voir le rapport complet :https://go.hyper.ai/ziRvz
Une équipe du laboratoire d'informatique et d'intelligence artificielle du MIT, en collaboration avec des chercheurs du Massachusetts General Hospital et de la Harvard Medical School, a proposé un modèle général de segmentation d'images biomédicales interactives, ScribblePrompt, un outil de segmentation basé sur un réseau neuronal qui prend en charge les annotateurs utilisant différentes méthodes d'annotation telles que les graffitis, les clics et les cadres de délimitation pour effectuer de manière flexible des tâches de segmentation d'images biomédicales, même pour les étiquettes et les types d'images non formés. Cet article est une interprétation et un partage détaillés du document.
Voir le rapport complet :https://go.hyper.ai/QQjAf
Articles populaires de l'encyclopédie
1. Fonction sigmoïde
2. Test t apparié
3. Apprentissage contrastif
4. Apprentissage semi-supervisé
5. Augmentation des données
Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :

Suivi unique des principales conférences universitaires sur l'IA :https://go.hyper.ai/event
Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !
À la semaine prochaine !
À propos d'HyperAI
HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :
* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 300 ensembles de données publiques
* Comprend plus de 400 tutoriels en ligne classiques et populaires
* Interprétation de plus de 100 cas d'articles AI4Science
* Prise en charge de plus de 500 termes de recherche associés
* Hébergement de la première documentation complète d'Apache TVM en Chine
Visitez le site Web officiel pour commencer votre parcours d'apprentissage :