HyperAI

Déployez Llama3 8B/70B En Un Clic ! La Taille De Stockage Maximale Est De Seulement 1,07 Go ; Lancement De COCONut, Le Premier Ensemble De Données De Segmentation D'images Panoramiques À Grande Échelle Lancé Par ByteDance

特色图像

Récemment, Meta a choqué le monde en lançant le grand modèle Llama3, connu sous le nom de « GPT-4 open source ». Ce modèle a choqué tout le cercle de l'IA, et HyperAI a hâte d'en faire l'expérience !Le site officiel hyper.ai a désormais lancé le tutoriel public « Déploiement en un clic de Llama3 » !Est-ce que quelqu’un se frotte les mains avec autant d’enthousiasme que moi ? Allons-y maintenant~

Du 22 au 26 avril, le site officiel de hyper.ai a été mis à jour :

* Ensembles de données publiques de haute qualité : 10

* Sélection de tutoriels de haute qualité : 3

* Sélection d'articles communautaires : 5 articles

* Entrées d'encyclopédie populaire : 5

Visitez le site officiel :hyper.ai

Ensembles de données publiques sélectionnés

1. Ensemble de données de segmentation d'images panoramiques à grande échelle COCONut

COCONut est le premier ensemble de données de segmentation d'images panoramiques annotées manuellement à grande échelle publié par ByteDance, contenant environ 383 000 images et 5,18 millions de masques de segmentation panoramiques annotés manuellement. Cette réalisation a été sélectionnée pour CVPR2024.

Utilisation directe :https://go.hyper.ai/43gIy

2. Ensemble de données sur les planètes du système solaire

Cet ensemble de données contient des images au format .jpg de toutes les planètes du système solaire. L'ensemble de données est divisé en un ensemble d'entraînement, un ensemble de test et un ensemble de validation. Chaque ensemble contient un sous-ensemble de 9 planètes différentes : Terre, Mercure, Vénus, Terre, Mars, Jupiter, Saturne, Uranus et Neptune.

Utilisation directe :https://go.hyper.ai/awnIo

3. Données sur le dialogue médical chinois

Cet ensemble de données est un ensemble de données de questions-réponses médicales chinoises, qui contient des dossiers de données de questions-réponses de 6 départements médicaux différents, chacun contenant un fichier csv. 

Utilisation directe : https://go.hyper.ai/scsmp

4. Ensemble de données du concours de mathématiques chinois TAL-SCQ5K

TAL-SCQ5K est un ensemble de données de compétition de mathématiques chinoises de haute qualité, comprenant 5 000 questions de compétition de mathématiques chinoises (3 000 pour la formation et 2 000 pour les tests), disponibles en chinois et en anglais.

Utilisation directe : https://go.hyper.ai/RqwbX

5. Ensemble de données de questions et réponses d'Anhui Telecom

Cet ensemble de données contient 156 000 données de questions et réponses sur Anhui Telecom, y compris les questions des utilisateurs, les réponses des internautes et les meilleures réponses. L'ensemble de données provient de Baidu Knows et convient aux tâches du système de questions et réponses FAQ.

Utilisation directe : https://go.hyper.ai/CMkpM

6. WikiArt Ensemble de données d'images Wiki Art

L'ensemble de données contient 80 020 images uniques provenant de 1 119 artistes différents et de 27 styles. Les données proviennent de WikiArt.org. L'ensemble de données WikiArt ne peut être utilisé qu'à des fins de recherche non commerciales.

Utilisation directe : https://go.hyper.ai/nCKMw

7. Ensemble de données sur les merveilles du monde

Cet ensemble de données contient 50 des monuments les plus étonnants du monde, sélectionnés dans la célèbre liste des sept nouvelles merveilles. Les informations de l'ensemble de données comprennent le nom, le type, l'emplacement, le lien Wikipédia, le lien vers l'image et l'année de construction du point de repère.

Utilisation directe : https://go.hyper.ai/qQLA4

8. Photos Google Landmarks Ensemble de données d'images Google Landmarks

L'ensemble de données contient les URL d'environ 120 000 images de points de repère, chacune possédant un identifiant unique, ce qui facilite les tâches de reconnaissance d'instance et de récupération d'images.

Utilisation directe :https://go.hyper.ai/fJ5kO

9. Fichier de données mondiales SIG

Cet ensemble de données est un ensemble de données de formes de cartes du monde, comprenant des cartes de différentes échelles, telles que les frontières nationales, la gestion administrative de premier niveau (provinces, États, etc.), les zones contestées, les côtes et les zones densément peuplées.

Utilisation directe :https://go.hyper.ai/hcwKe

10. Ensemble de données SSDO sur l'oxygène dissous à grande échelle à la surface de la mer

Cet ensemble de données est celui utilisé dans l'article « Cartographie et interprétation de l'oxygène de la surface de la mer à l'échelle mondiale par satellite basée sur l'apprentissage automatique spatiotemporel ». Sur la base du cadre DOsurface-Pred, l'équipe de recherche a généré un ensemble de données à grande échelle sur l'oxygène dissous à la surface de la mer couvrant la période 2010-2018, comprenant des données satellitaires, des navires fixes et des données de mesure de conductimètre.

Utilisation directe :https://go.hyper.ai/d9w8B

Pour plus d'ensembles de données publics, veuillez visiter:

https://hyper.ai/datasets

Tutoriels publics sélectionnés

1. Déployer Llama3-8B-Instruct avec Ollama et Open WebUI

Ce tutoriel est un package d'exécution en un clic d'Ollama + Open WebUI. Il vous suffit d'entrer les commandes étape par étape pour exécuter le grand modèle Llama3-8B-Instruct.

Exécutez en ligne :https://go.hyper.ai/7lZyb

2. Déployez Llama3-70B à l'aide d'Ollama et d'Open WebUI

Ce tutoriel utilise les outils Ollama et Open WebUI pour exécuter le modèle en un clic. Il vous suffit d'entrer les commandes étape par étape pour exécuter le grand modèle Llama3-70B. Bien que les paramètres du modèle soient importants, il peut être utilisé avec une seule carte A6000 après le déploiement de la plate-forme, occupant seulement 1,07 Go de stockage.

Exécutez en ligne :https://go.hyper.ai/u4XHj

3. Tutoriel en ligne Le volume de transactions des débuts de Liu Qiangdong en tant qu'humain numérique a dépassé les 50 millions ! Générez un humain numérique parlant en temps réel avec GeneFace++

GeneFace++ est une technologie générale et stable de génération de visages parlants 3D pilotée par l'audio en temps réel qui peut réaliser la génération de visages parlants en temps réel en améliorant la synchronisation labiale, la qualité vidéo et l'efficacité du système. Le tutoriel « GeneFace++ Digital Human Demo » est désormais disponible sur le site officiel de hyper.ai, et l'environnement a été mis en place pour tout le monde, simplifiant le processus de production humaine numérique. Vous n’avez pas à vous soucier de la configuration environnementale, des exigences matérielles, de la compatibilité des versions et d’autres problèmes. Cliquez sur la course en ligne pour la démarrer en un clic.

Exécutez en ligne :https://go.hyper.ai/4BwgN

Articles de la communauté

1. [Résumé des ensembles de données mathématiques] Le docteur de génie Terence Tao recommande vivement les ensembles de données ! Contient du code, des questions de compétition chinoises, des réponses aux questions avant et arrière, etc.

Voici les choses utiles ! hyper.ai a compilé 10 ensembles de données de classification mathématique, y compris des ressources d'ensembles de données hautement recommandées par le mathématicien de génie Terence Tao, pour aider au développement et à la recherche de l'IA pour les mathématiques.

Voir les informations détaillées :https://go.hyper.ai/6Vhrb

2. Sur la base des données cliniques de 627 patients aux États-Unis et au Japon, Google a confirmé l'efficacité du dépistage du cancer du poumon assisté par l'IA dans la population

Sur la base du développement rapide de l'IA, l'équipe de Google a étudié comment les modèles d'apprentissage automatique peuvent communiquer efficacement les résultats de la recherche aux radiologues, a évalué l'impact des systèmes généralisés assistés par l'IA sur les flux de travail de dépistage du cancer du poumon dans des environnements de flux de travail, des équipements et des directives spécifiques à chaque pays et des protocoles de notation/gestion, et a mené des tests aux États-Unis et au Japon. Les résultats ont montré qu’avec l’aide de l’intelligence artificielle, le temps moyen de dépistage pour chaque cas pourrait être réduit de 14 secondes. Le document de recherche a été publié dans la revue « Radiology AI ».

Voir le rapport complet :https://go.hyper.ai/wiCl0

3.【Résumé de l'événement】L'IA rencontre la science à l'Université de New York ; 16e Conférence internationale sur la bioinformatique et les technologies biomédicales ; Bio-IT World 2024

HyperAI a collecté des conférences verticales sur l'IA pour la science au pays et à l'étranger, et a organisé des informations et des liens sur les conférences. Vous pouvez accéder directement à la page d’accueil officielle en un clic, pour ne manquer aucun événement poids lourd ! Cet article est un résumé des activités récentes.

Voir l'article complet :https://go.hyper.ai/HTGNG

4. Suivi de particules individuelles à l'échelle nanométrique : l'équipe de Fang Ning à l'Université de Xiamen utilise l'IA pour jouer à « Rock in the Cell »

L'équipe du professeur Fang Ning de l'Université de Xiamen a développé un système de suivi automatisé, à grande vitesse et multidimensionnel de particules uniques basé sur l'apprentissage profond, qui brise les limites du suivi rotationnel des nanoparticules dans les microenvironnements cellulaires et permet un suivi complet et précis des molécules uniques/nanoparticules uniques dans les cellules vivantes à l'échelle nanométrique. Cet article est une interprétation détaillée et un partage de la recherche. L'article a été publié dans la revue faisant autorité « Nano Letters ».

Voir le rapport complet :https://go.hyper.ai/G4k2e

5Déconstruire l'hypoxie océanique : le laboratoire SIG de l'université du Zhejiang intègre l'apprentissage automatique et la cartographie par satellite pour publier un cadre de modélisation complet de l'oxygène dissous à la surface de la mer mondiale

Des chercheurs du laboratoire SIG de l'Université du Zhejiang ont combiné la technologie d'apprentissage automatique avec des produits satellitaires pour développer un cadre de modélisation complet de l'oxygène dissous à la surface de la mer à l'échelle mondiale, DOsurface-Pred Framework, qui a confirmé que même dans les zones de surface de la mer suffisamment riches en oxygène, la teneur en oxygène dissous a montré une tendance à la baisse, et cette tendance est principalement attribuée aux changements de température de la surface de la mer. Le document de recherche a été publié dans ACS Publications.

Voir le rapport complet :https://go.hyper.ai/NlRmn

Articles populaires de l'encyclopédie

1. Jeton Glitch

2. Modèle de langage multimodal à grande échelle (MLLM)

3. Modélisation du langage masqué (MLM)

4. Attention aux requêtes de groupe GQA

5. Auto-encodeur variationnel VAE

Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :

https://hyper.ai/wiki

Aperçu de la diffusion en direct de la station B

Google a récemment annoncé qu'il organiserait la conférence des développeurs I/O 2024 le 14 mai, heure locale. Afin d'aider chacun à acquérir une compréhension plus approfondie,La Super Neuron Live Room continuera à diffuser la vidéo « Google Special ».Comprend : des conférences de presse Google I/O au fil des ans, des entretiens avec des dirigeants, des documentaires connexes et d'autres contenus riches.

Le tableau suivant est un aperçu du contenu sélectionné par l'éditeur↓↓↓

datetempscontenu
29 avril
Lundi
18:00Conférences Google I/O au fil des ans
Mardi 30 avril18:00Conférences Google Cloud NEXT
Mercredi 1er mai18:00Entretien avec Sundar Pichai sur TIME100 
Jeudi 2 mai18:00Le PDG de Google s'exprime sur la course à l'IA entre les États-Unis et la Chine
Vendredi 3 mai18:00Documentaire AlphaGo
Samedi 4 mai18:00L'histoire du fondateur de Google
Dimanche 5 mai18:00Documentaire de la BBC : Un monde sans Google

Super Neuro TV diffuse en direct 24h/24 et 7j/7. Cliquez pour obtenir les « cornichons électroniques » dans le domaine de l'IA :

http://live.bilibili.com/26483094

Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !

À la semaine prochaine !

À propos d'HyperAI

HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :

* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 400 ensembles de données publiques

* Comprend plus de 300 tutoriels en ligne classiques et populaires

* Interprétation de plus de 100 cas d'articles AI4Science

* Prise en charge de plus de 500 termes de recherche associés

* Hébergement de la première documentation complète d'Apache TVM en Chine

Visitez le site Web officiel pour commencer votre parcours d'apprentissage :

https://hyper.ai