Exécution En Ligne Du Seul Modèle Open Source 70B De Llama 3.3, Performances Comparables À 405B ! L'ensemble De Données OCR LaTeX Est Désormais Disponible Pour Aider À La Reconnaissance Des Formules Mathématiques

Ce mois-ci, Meta a publié le seul modèle open source de Llama 3.3, Llama-3.3-70B-Instruct. Bien que la taille du paramètre ne soit que de 70B, ses performances sont comparables à celles du modèle 405B. Il s'agit du dernier modèle de la série Llama 3. Zuckerberg a déclaré : au revoir sera Llama 4 !
Le site officiel hyper.ai a lancé « Déploiement en un clic de Llama-3.3-70B-Instruct » dans la section didacticiel. Découvrons ensemble l'œuvre finale de Llama 3~
Utilisation en ligne :https://go.hyper.ai/TthEw
Du 23 au 29 décembre, le site officiel de hyper.ai est mis à jour :
* Ensembles de données publiques de haute qualité : 10
* Sélection de tutoriels de haute qualité : 3
* Sélection d'articles communautaires : 6 articles
* Entrées d'encyclopédie populaire : 5
* Principales conférences avec dates limites en janvier : 9
Visitez le site officiel :hyper.ai
Ensembles de données publiques sélectionnés
1. Ensemble de données de description d'images CompreCap
L'ensemble de données contient 560 images, chacune d'entre elles ayant été finement segmentée sémantiquement et annotée avec des objets, des attributs et des relations pour former une structure de graphe de scène orientée complète.
Utilisation directe :https://go.hyper.ai/icfaH

2. Ensemble de données de reconnaissance de casque HelmetViolations
L'ensemble de données contient un total de 1 004 images, annotées au format YOLOv9, et contient 3 catégories : plaque d'immatriculation (Plate), avec casque (WithHelmet) et sans casque (WithoutHelmet). L'ensemble d'entraînement contient 363 images (originales + augmentées) ; l'ensemble de validation comporte 53 images ; l'ensemble de tests est inclus dans l'exportation pour l'évaluation du modèle.
Utilisation directe :https://go.hyper.ai/N0Yyg

3. SynCamVideo-Dataset Ensemble de données vidéo synchrone multi-caméras
L'ensemble de données contient 1 000 scènes différentes, chacune capturée par 36 caméras, générant un total de 36 000 vidéos, avec 50 animaux différents comme « sujets principaux » et utilisant 20 emplacements différents de Poly Haven comme arrière-plans.
Utilisation directe :https://go.hyper.ai/oIJns

4. Classification des images aériennes Ensemble de données de classification des images d'aéronefs
Cet ensemble de données est un ensemble de données contenant 3 371 images d'avions, qui sont divisées en 10 dossiers de catégories, chaque catégorie correspond à un modèle d'avion spécifique : A10, A400M, AG600, AH64, AV8B, An124, An22, An225, An72 et B1, etc.
Utilisation directe :https://go.hyper.ai/IL3uP

5. Ensemble de données d'images de bandes dessinées MangaZero
L'ensemble de données MangaZero est un ensemble de données d'images de bandes dessinées à grande échelle, à plusieurs caractères et à plusieurs états, conçu spécifiquement pour les tâches de génération de bandes dessinées. Il contient 43 264 pages de bandes dessinées et 427 147 panneaux annotés. Il prend en charge la visualisation de diverses interactions et actions de personnages dans des images consécutives et convient aux tâches de génération de bandes dessinées multi-personnages et multi-états.
Utilisation directe :https://go.hyper.ai/IpkjL
6. Ensemble de données de reconnaissance de formules mathématiques LaTeX OCR
L'ensemble de données LaTeX OCR est un ensemble de données qui se concentre sur le problème complexe de reconnaissance de formules mathématiques dans le domaine de la reconnaissance optique de caractères (OCR). L'ensemble de données LaTeX OCR contient plusieurs configurations, chacune avec des fonctionnalités et un partitionnement de données différents.
Utilisation directe :https://go.hyper.ai/lyK1J
7. Ensemble de données de localisation open source FSQ OS Places
Cet ensemble de données contient plus de 100 millions de points d'intérêt (POI) mondiaux, couvrant plus de 200 pays et régions, rendant des données géospatiales riches accessibles aux chercheurs, aux développeurs et aux entreprises. Il fournit 22 attributs de base, notamment des informations clés telles que le nom du lieu, l'adresse, la longitude et la latitude, qui prennent en charge diverses applications telles que l'analyse géospatiale et les services de positionnement.
Utilisation directe :https://go.hyper.ai/7oN5M
8. Ensemble de données de référence de raisonnement mathématique ProcessBench
Cet ensemble de données contient 3,4 000 exemples de tests, axés sur des problèmes mathématiques de difficulté compétition et Olympiade. Chaque exemple est accompagné d'une solution étape par étape et d'un marquage précis des erreurs par des experts du domaine.
Utilisation directe :https://go.hyper.ai/fk3hq
Cet ensemble de données médicales chinoises est une ressource complète pour développer et former des modèles linguistiques capables de fournir des conversations et des recommandations professionnelles dans le domaine médical. Il combine plusieurs types de données, notamment des connaissances encyclopédiques, des textes de manuels, des conversations réelles entre médecins et patients et des données d'évaluation, pour améliorer la précision et la praticité du modèle.
Utilisation directe :https://go.hyper.ai/wkAXX
10. Tutoriel sur la correction de l'anisotropie et du désalignement splsoNet
spIsoNet est un logiciel d'apprentissage profond auto-supervisé de bout en bout pour résoudre les problèmes d'anisotropie de carte et de désalignement des particules causés par le problème d'orientation préférée. Cet ensemble de données est utilisé dans la recherche et les résultats associés ont été publiés dans la revue universitaire internationale Nature Methods.
Utilisation directe :https://go.hyper.ai/tFOqJ
Tutoriels publics sélectionnés
1. Déploiement en un clic de Llama-3.3-70B-Instruct
Llama-3.3-70B-Instruct est un grand modèle de langage lancé par Meta en 2024. C'est le seul modèle open source de la série Llama 3.3 et dispose d'une version de réglage fin des instructions spécialement optimisée.
Le modèle a configuré l'environnement et les dépendances. Vous pouvez démarrer une conversation avec le modèle en saisissant l'adresse API.
Exécutez en ligne :https://go.hyper.ai/TthEw

2. Démo vidéo HunyuanVideo Tencent Hunyuan Wensheng
HunyuanVideo vise à aider les utilisateurs à générer du contenu vidéo de haute qualité grâce à la technologie de l'intelligence artificielle. HunyuanVideo est le modèle vidéo Wensheng avec le plus grand nombre de paramètres parmi les modèles open source actuels, avec 13 milliards de paramètres. Il peut générer du contenu vidéo avec une précision physique élevée et une cohérence de scène, offrir aux utilisateurs une expérience visuelle hyperréaliste et peut basculer librement entre les styles réels et virtuels.
Le projet fournit une interface Web pratique et les utilisateurs peuvent générer des vidéos de différents styles en fournissant simplement une description textuelle simple ou en spécifiant des conditions.
Exécutez en ligne :https://go.hyper.ai/hEkOw

3. Tutoriel Triton : Multiplication de matrices
Dans ce tutoriel, vous écrirez un noyau de multiplication de matrice FP16 très court et très performant dont les performances sont comparables à celles de cuBLAS ou rocBLAS. Plus précisément, vous apprendrez : la multiplication de matrices à plusieurs niveaux ; arithmétique de pointeurs multidimensionnels; réorganisation du programme pour améliorer les taux de réussite du cache L2 ; et réglage automatique des performances.
Exécutez en ligne :https://go.hyper.ai/riM7b

Articles de la communauté
HyperAI a sélectionné et classé 26 articles de pointe interprétés au cours de la période 2023-2024. Cet article se concentre sur la recherche de l’IA dans le domaine de la chimie des matériaux. C'est une critique complète, alors cliquez pour la lire rapidement.
Voir le rapport complet :https://go.hyper.ai/XnzcN
En tant qu'entreprise chimique britannique de haute technologie, Chemify a développé la première « machine de Turing chimique » au monde et le premier compilateur chimique au monde. Elle s'engage à intégrer l'informatique chimique, l'intelligence artificielle, la robotique, l'automatisation, etc. dans la recherche et le développement de médicaments pour promouvoir le développement numérique de la chimie. Cet article est un rapport détaillé sur l'entreprise, cliquez pour le lire rapidement.
Voir le rapport complet :https://go.hyper.ai/V5VWB
Le professeur Tu Wei, le professeur Lu Feng et d'autres de l'Université des sciences et technologies de Huazhong ont proposé un modèle de segmentation d'images médicales capable d'identifier avec précision les foyers d'agrégation de lymphocytes dans les images pathologiques de patients atteints du syndrome de Sjögren, aidant ainsi les médecins à établir des diagnostics plus rapides et plus précis. Cet article est une interprétation et un partage détaillés du document.
Voir le rapport complet :https://go.hyper.ai/EetpB
L'équipe de Zhang Shixin à l'Université chinoise des géosciences (Pékin) mène des recherches sur les capteurs visuo-tactiles depuis 2014. Ils ont exploré et développé plusieurs générations de technologies de capteurs et les ont appelées TactEdge, une technologie tactile de pointe. Cet article est une introduction détaillée aux résultats de recherche pertinents. Cliquez pour le lire rapidement.
Voir le rapport complet :https://go.hyper.ai/nOE2a
5. Un aperçu des avancées de l'IA médicale en 2024 : 35 articles de pointe à ne pas manquer
Cet article se concentre sur la recherche sur l’IA dans le domaine de la santé. Nous avons sélectionné 35 articles de pointe interprétés au cours de la période 2023-2024 pour que vous puissiez partager des produits super secs. Cliquez pour lire rapidement.
Voir le rapport complet :https://go.hyper.ai/CZdYT
L'Université de Californie à Berkeley, Microsoft Research et d'autres ont proposé une méthode de génération de protéines multimodales PLAID, qui peut réaliser une génération multimodale en générant des modalités plus rares à partir de modalités de données plus riches. Cet article est une interprétation et un partage détaillés du document.
Voir le rapport complet :https://go.hyper.ai/nwnDy
Articles populaires de l'encyclopédie
1. Fonction sigmoïde
2. Fusion de tri réciproque RRF
3. Norme nucléaire
4. Grand modèle de langage
5. Mémoire à long terme
Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :

Suivi unique des principales conférences universitaires sur l'IA :https://go.hyper.ai/event
Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !
À la semaine prochaine !