Choix Hebdomadaires De L'éditeur | Hometown Chicken Open Source « Rapport Sur L'origine Du Plat », Outil SUPIR De Réparation De Photos Anciennes, Utilisation En Ligne

Dernières nouvelles ! Dernières nouvelles !Les « documents confidentiels » de Lao Xiang Ji ont été rendus publics !
Récemment, Lao Xiang Ji a publié au public son « Rapport de traçabilité des aliments Lao Xiang Ji » de 200 000 mots, indiquant clairement tout, de la source des ingrédients aux détails de cuisson. Il est maintenant disponible en téléchargement sur Chao Shen Wang, venez voir s'il y a quelque chose que vous aimez !
PS : L'éditeur veut juste demander, si le travail échoue selon le rapport, puis-je déposer un problème ?
Du 15 au 19 avril, le site officiel de hyper.ai est mis à jour :
* Ensembles de données publiques de haute qualité : 10
* Tutoriels sélectionnés de haute qualité : 2
* Sélection d'articles communautaires : 3 articles
* Entrées d'encyclopédie populaire : 5
Visitez le site officiel :hyper.ai
Ensembles de données publiques sélectionnés
1. Rapport de traçabilité des aliments à base de poulet fait maison
L'ensemble de données couvre 1 218 restaurants Lao Xiang Ji actuels, 226 SKU, 873 ingrédients et 305 fournisseurs. Lao Xiang Ji a rendu public son « Rapport sur la traçabilité des aliments de Lao Xiang Ji », long de 677 pages et 200 000 mots.
Utilisation directe :https://go.hyper.ai/nbESl
2. Ouvrir le jeu de données vidéo du projet Sora Dataset
Open-Sora-Plan est un projet open source qui vise à reproduire le Sora d'OpenAI (modèle T2V). Cet ensemble de données est un ensemble de données vidéo pour son projet. L'équipe de recherche a analysé 40 258 vidéos provenant de sites Web open source sous licence CC0. Toutes les vidéos sont de haute qualité et sans filigrane, dont environ 60% sont des données en mode paysage.
Utilisation directe :https://go.hyper.ai/75Ftc
3. Ensemble de données de capture de mouvement multimodal MMVP
Cet ensemble de données contient de nombreux mouvements humains rapides et à grande échelle, tels que la course, le saut à la corde, le saut en longueur debout, etc., et un total de plus de 44 000 images RGBD synchronisées et de données de pression provenant de 16 sujets ont été collectées.
Utilisation directe : https://go.hyper.ai/4edeR
4. OpenWebMath Ensemble de données de formation en mathématiques sur le Web ouvert
OpenWebMath est un ensemble de données contenant des textes mathématiques de haute qualité provenant de la majeure partie d'Internet. Il est filtré et extrait de plus de 200 milliards de fichiers HTML sur Common Crawl, ce qui donne un ensemble de 6,3 millions de documents contenant un total de 14,7 milliards de jetons. OpenWebMath est conçu pour la pré-formation et le réglage fin de grands modèles linguistiques.
Utilisation directe : https://go.hyper.ai/zjytq
5. Ensemble de données mathématiques Proof-Pile-2
Proof-Pile-2 est un ensemble de données tokenisé de 55 milliards de documents mathématiques et scientifiques. Un mélange d'articles scientifiques, de contenu Web lié aux mathématiques et de code mathématique mis à jour en avril 2023 (à l'exclusion d'un sous-ensemble spécifique d'étapes de preuve Lean). Cet ensemble de données a été créé pour former les modèles Llemma 7B et Llemma 34B.
Utilisation directe : https://go.hyper.ai/aant8
6. Ensemble de données mathématiques Mizar
La bibliothèque mathématique Mizar contient des théorèmes et des preuves mathématiques formalisés couvrant un large éventail de domaines mathématiques, notamment la logique, l'algèbre, l'analyse, la géométrie, etc. L'objectif de cette bibliothèque est de fournir une base mathématique solide pour la preuve automatisée de théorèmes et le raisonnement formel.
Utilisation directe : https://go.hyper.ai/IJeHa
7. Corpus parallèle d'Isabelle
Le Corpus Parallèle Isabelle (IPC) est une initiative communautaire visant à créer un corpus parallèle de documents Isabelle. L'IPC associe des documents formels dans Isabelle (tels que des théorèmes, des lemmes, des définitions, etc.) à leurs homologues en langage naturel.
Utilisation directe : https://go.hyper.ai/BEADY
8. Ensemble de données sur les fruits Ensemble de données sur la classification de la fraîcheur des fruits
Cet ensemble de données contient des images de trois types de fruits : pommes, oranges et bananes. Chaque image est étiquetée en fonction de son type de fruit et de son état de fraîcheur, permettant des tâches d'apprentissage supervisées telles que la classification ou la détection d'objets.
Utilisation directe :https://go.hyper.ai/b7TNx
9. Ensemble de données de classification d'images de fruits DeepFruit
DeepFruit est un ensemble de données de classification d'images de fruits publié conjointement par l'Université Prince Mohammed bin Fahd et d'autres instituts de recherche. L'ensemble de données contient 21 122 images de fruits basées sur 8 ensembles de fruits différents. Il peut être utilisé pour la recherche dans le domaine de la détection, de l'identification et de la classification des fruits, ainsi que pour d'autres applications innovantes telles que l'estimation des calories.
Utilisation directe :https://go.hyper.ai/ut4BA
10. 15 Ensembles de données de classification d'images animales
L'ensemble de données contient des dossiers d'images de 15 animaux, toutes les images sont de taille 224X224, adaptées à la classification des images. Les images ont été téléchargées depuis Internet et prétraitées (redimensionnement et amélioration) à l'aide de la bibliothèque OpenCV. Par conséquent, cet ensemble de données peut être directement utilisé pour la formation sans augmentation supplémentaire des données.
Utilisation directe :https://go.hyper.ai/tgMtH
Pour plus d'ensembles de données publics, veuillez visiter:
Tutoriels publics sélectionnés
L'outil de restauration d'image SUPIR utilise la technologie StableDiffusion-XL (SDXL) et l'extension de modèle, et peut améliorer considérablement la qualité de la restauration d'image grâce à l'apprentissage automatique et aux méthodes multimodales. Ce tutoriel a créé un environnement pour tout le monde. Sans aucune préparation préalable compliquée, vous pouvez réparer l'image en un clic.
Exécutez en ligne :https://go.hyper.ai/3RBMH
2. Déployez de grands modèles avec Ollama et Open WebUI
Ce tutoriel est un package d'exécution en un clic d'Ollama + Open WebUI. Il vous suffit de suivre les étapes et d'entrer les commandes pour exécuter le grand modèle. Les modèles actuellement inclus sont : qwen 1.5 14b, qwen 1.5 32b, llava 1.6 34b, et prennent en charge le téléchargement de nouveaux modèles par vous-même.
Exécutez en ligne :https://go.hyper.ai/FwREK
Articles de la communauté
Le groupe de recherche dirigé par le professeur adjoint Yulian He de l'Institut conjoint de l'Université Jiao Tong de Shanghai a proposé une nouvelle méthode pour déterminer les quantités physiques clés qui déterminent l'Eads, à savoir une expérience de suppression de caractéristiques basée sur l'apprentissage automatique, qui réalise l'extraction automatique des connaissances à partir de la base de données de la théorie fonctionnelle de la densité à haut débit. Cet article est une interprétation détaillée et un partage de la recherche.
Voir le rapport complet :https://go.hyper.ai/LEVS1
L’équipe de Google a développé un modèle de prévision fluviale basé sur l’apprentissage automatique. La capacité prédictive du modèle est meilleure que celle du système de prévision des inondations le plus avancé au monde, GloFAS. Il peut faire des prévisions d’inondation fiables 5 jours à l’avance et couvrir plus de 80 pays. Cet article est un partage et une interprétation de la recherche.
Voir l'article complet :https://go.hyper.ai/V4r4i
L'équipe de recherche de l'Université Jiao Tong de Shanghai a proposé une méthode d'apprentissage semi-supervisé PBCT, qui exploite pleinement les données non étiquetées peu coûteuses et abondantes générées pendant tout le cycle de vie des batteries au lithium. En extrayant des informations cachées, il approfondit la compréhension des modèles de données sous-jacents et améliore la précision de la prédiction de la durée de vie des batteries au lithium par 20%. Cet article est un partage et une interprétation de la recherche.
Voir le rapport complet :https://go.hyper.ai/2EQGa
Articles populaires de l'encyclopédie
1. Époque
2. Taux d'apprentissage
3. Test t apparié
4. Modèle de diffusion
5. Grand modèle de langage
Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :
Aperçu de la diffusion en direct de la station B
Google a récemment annoncé qu'il organiserait la conférence des développeurs I/O 2024 le 14 mai. Afin d'aider chacun à acquérir une compréhension plus approfondie de Google,La salle de diffusion en direct super neuronaleÀ partir de lundi prochain, nous diffuserons la vidéo « Google Special » en direct 24h/24 et 7j/7.Comprend : des conférences de presse Google I/O au fil des ans, des entretiens avec des dirigeants, des documentaires connexes et d'autres contenus riches.
Le tableau suivant est un aperçu du contenu sélectionné par l'éditeur↓↓↓
date | temps | contenu |
15 avril Lundi | 18:00 | Conférences Google I/O au fil des ans |
Mardi 16 avril | 18:00 | Conférences Google Cloud NEXT |
Mercredi 17 avril | 18:00 | Entretien avec Sundar Pichai sur TIME100 |
Jeudi 18 avril | 18:00 | Le PDG de Google s'exprime sur la course à l'IA entre les États-Unis et la Chine |
Vendredi 19 avril | 18:00 | Documentaire AlphaGo |
Samedi 20 avril | 18:00 | L'histoire du fondateur de Google |
Dimanche 21 avril | 18:00 | Documentaire de la BBC : Un monde sans Google |
Super Neuro TV diffuse en direct 24h/24 et 7j/7. Cliquez pour obtenir les « cornichons électroniques » dans le domaine de l'IA :
http://live.bilibili.com/26483094
Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !
À la semaine prochaine !
À propos d'HyperAI
HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :
* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques
* Comprend plus de 300 tutoriels en ligne classiques et populaires
* Interprétation de plus de 100 cas d'articles AI4Science
* Prise en charge de plus de 500 termes de recherche associés
* Hébergement de la première documentation complète d'Apache TVM en Chine
Visitez le site Web officiel pour commencer votre parcours d'apprentissage :