HyperAI

L'ensemble De Données De Référence MMLU-Pro Est Désormais Disponible, Contenant 12 000 Problèmes Interdisciplinaires Complexes. C'est Plus Difficile ! Déploiement En Un Clic Du Modèle Mathématique DeepSeek

特色图像

À l’ère des grands modèles de langage (LLM), des benchmarks tels que Massive Multi-Task Language Understanding (MMLU) jouent un rôle crucial pour repousser les limites des capacités de compréhension du langage et de raisonnement de l’IA dans différents domaines.

Cependant, avec l’amélioration et l’optimisation continues du modèle, les performances du LLM dans ces benchmarks se sont progressivement stabilisées, ce qui rend de plus en plus difficile de distinguer les différences dans les capacités des différents modèles.

Afin de mieux évaluer les capacités du LLM, des chercheurs de l’Université de Waterloo, de l’Université de Toronto et de l’Université Carnegie Mellon ont publié conjointement l’ensemble de données MMLU-Pro, qui intègre des questions provenant de plusieurs sources, notamment l’ensemble de données MMLU original, les sites Web STEM, TheoremQA et SciBench.L'ensemble de données est désormais disponible en téléchargement sur hyper.ai. Faites défiler vers le bas pour obtenir le lien~

Du 9 au 14 septembre, le site officiel hyper.ai est mis à jour :

* Ensembles de données publiques de haute qualité : 10

* Sélection de tutoriels de haute qualité : 3

* Sélection d'articles communautaires : 4 articles

* Entrées d'encyclopédie populaire : 5

* Principales conférences avec date limite en septembre : 3

Visitez le site officiel :hyper.ai

Ensembles de données publiques sélectionnés

1. Ensemble de données de compréhension multitâche à grande échelle MMLU-Pro

L'ensemble de données MMLU-Pro est un ensemble de données de compréhension multitâche à grande échelle plus puissant et plus stimulant, conçu pour évaluer plus rigoureusement les capacités des grands modèles linguistiques. L'ensemble de données contient 12 000 questions complexes dans toutes les disciplines.

Utilisation directe : https://go.hyper.ai/PwJDW

2. Ensemble de données d'extraction de routes DeepGlobe18

Les données d’entraînement pour le Road Challenge contiennent 6 226 images satellites RVB d’une taille de 1024 × 1024. Les images ont une résolution de 50 cm pixels et sont collectées par les satellites de DigitalGlobe.

Utilisation directe : https://go.hyper.ai/VIg0J

3. Ensemble de données de détection de falsification de visage OpenForensics

L'ensemble de données comprend 115 000 images naturelles et 334 000 visages, tous dotés d'annotations faciales riches, notamment des catégories de falsification, des cadres de délimitation, des masques de segmentation, des limites de falsification et des repères faciaux généraux, couvrant divers arrière-plans et plusieurs personnes d'âges, de sexes, de poses, de positions et d'occlusions faciales différents.

Utilisation directe : https://go.hyper.ai/jTTRz

4. Ensemble de données de détection de deep fake TIMIT

L'ensemble de données contient des vidéos de visages échangés à l'aide d'une approche open source basée sur un réseau antagoniste génératif (GAN). Ces vidéos ont été créées sur la base de l'algorithme Deepfake original basé sur un autoencodeur.

Utilisation directe : https://go.hyper.ai/me1TI

5. Base de données de documents synthétiques SESYD

L'ensemble de données contient des images de documents avec des informations réelles de référence. Il se compose de 11 ensembles, comprenant 284 000 images, 190 000 symboles et 284 000 caractères. Il se concentre sur deux problèmes de recherche majeurs dans le domaine de l'analyse d'images de documents : (1) la reconnaissance et la localisation de symboles dans les images de dessin en ligne (telles que les plans d'étage et les schémas de circuits) ; (2) segmentation et reconnaissance des caractères dans les cartes géographiques.

Utilisation directe : https://go.hyper.ai/ZqRTQ

6. Ensemble de données audiovisuelles multimodales DeepFake LAV-DF

LAV-DF est un ensemble de données multimodal (falsification vidéo et falsification audio) dérivé de l'ensemble de données VoxCeleb2, contenant 136 304 vidéos, dont 36 431 vidéos réelles et 99 873 fausses vidéos.

Utilisation directe : https://go.hyper.ai/ujock

7. Ensemble de données de location de vêtements Vibrant Ensemble de données de location de vêtements

L'ensemble de données contient 64 000 transactions, les historiques de location de 2,2 000 utilisateurs anonymes et 15,8 000 tenues uniques, avec des informations détaillées sur les propriétés et l'historique de location de chaque article. Tous les articles vestimentaires sont répertoriés comme des produits individuels ou leurs groupes de produits correspondants, faisant référence à des conceptions partagées entre les articles individuels, et chaque article vestimentaire est accompagné d'un ensemble d'étiquettes décrivant certains de ses attributs.

Utilisation directe :https://go.hyper.ai/PFlKA

8. Ensemble de données sur la falsification de visages FFIW10K

Les données comprennent 10 000 fausses vidéos de haute qualité collectées sur YouTube, avec une moyenne de trois visages par image. Chaque vidéo contient de vrais visages et de faux visages, ce qui est plus proche de scènes réalistes et complexes. Le processus de manipulation est entièrement automatique et contrôlé par un réseau d'évaluation de la qualité contradictoire du domaine, ce qui rend l'ensemble de données hautement évolutif et à faible coût de main-d'œuvre.

Utilisation directe : https://go.hyper.ai/AHS7y

9. Ensemble de données de falsification de visage ForgeryNet

L'ensemble de données contient 2,9 millions d'images et 221 247 vidéos, couvrant 7 méthodes de falsification au niveau de l'image et 8 au niveau de la vidéo du monde entier. Cet ensemble de données fournit aux chercheurs de riches ressources pour prendre en charge quatre tâches aux niveaux de l'image et de la vidéo : la classification des falsifications d'images, la localisation spatiale des falsifications, la classification des falsifications vidéo et la localisation temporelle des falsifications.

Utilisation directe : https://go.hyper.ai/Yx0mj

10. Ensemble de données EEG sur l'état de l'œil Ensemble de données EEG sur l'état des yeux

Cet ensemble de données contient des instances de mesures EEG, où la sortie est l'état des yeux ouverts ou fermés. Les valeurs de l'ensemble de données sont classées par ordre chronologique, où 0 représente l'état yeux ouverts et 1 représente l'état yeux fermés. L'ensemble de données contient 14 mesures EEG, étiquetées AF3, F7, F3, FC5, T7, P, O1, O2, P8, T8, FC6, F4, F8, AF4.

Utilisation directe :https://go.hyper.ai/RTBDy

Pour plus d'ensembles de données publics, veuillez visiter:

https://hyper.ai/datasets

Tutoriels publics sélectionnés

1. UnDéploiement clé DeepSeek-Prover-V1.5

Ce modèle est un modèle de preuve de théorème mathématique open source par DeepSeek en 2024. L'équipe de recherche a introduit ce modèle dans Lean 4. Le modèle construit un environnement d'apprentissage de style « Go » grâce à l'auto-itération et à la supervision du prouveur Lean. Ce tutoriel est un tutoriel étape par étape sur la façon d'utiliser la démonstration de déploiement en un clic du modèle.

Utilisation directe : https://go.hyper.ai/MevMB

2. Démo du modèle de vision globale multimodale LLaVA OneVision

Le modèle peut traiter des images, du texte, des entrées entrelacées image-texte et des vidéos. Il s’agit du premier modèle unique capable de surmonter simultanément les goulots d’étranglement des performances des modèles multimodaux ouverts dans ces trois scénarios importants de vision par ordinateur. Accédez au site Web officiel pour cloner et démarrer le conteneur, copiez directement l'adresse API, puis vous pourrez expérimenter l'inférence du modèle.

Utilisation directe: https://go.hyper.ai/Dcg74

3. Tutoriel en ligne | Monsieur, l’ère de Vincent van Gogh a encore changé ! Les membres principaux de SD ont créé leur propre entreprise, et le premier modèle FLUX.1 est un combat difficile contre SD 3 et Midjourney

La concurrence dans le modèle Wenshengtu devient de plus en plus féroce ! Les anciens membres principaux de Stable Diffusion ont créé leur propre entreprise et ont publié le modèle de graphique de texte FLUX, qui couvre tout, de l'utilisation commerciale à l'utilisation personnelle open source. L'effet généré est très proche de la prise de vue réelle et les détails des personnages sont très réalistes. Actuellement, hyper.ai a lancé « FLUX ComfyUI (y compris la version de formation Black Myth Wukong LoRA) », cliquez sur le lien ci-dessous pour déployer selon le tutoriel.

Directementutiliser:https://go.hyper.ai/trQhv

Articles de la communauté

1. Résumé de l'ensemble de données | Le chaos DeepFake est endémique, utilisez la magie pour vaincre la magie ! Des ensembles de données de haute qualité contribuent à faire progresser la technologie de détection des contrefaçons

Pour faire face au chaos de la reconnaissance faciale et du DeepFake, il est urgent de mettre à niveau la technologie de reconnaissance faciale et de détection de falsification pour déterminer avec précision si les images et les vidéos ont été falsifiées. HyperAI a compilé 11 ensembles de données de reconnaissance faciale et DeepFake couramment utilisés que vous pouvez télécharger en un seul clic.

Voir le résumé complet :https://go.hyper.ai/EMKo2

2. L'intelligence d'Apple explose tard dans la nuit ! Apple lance 4 puces développées en interne, des mises à niveau majeures pour iPhone/iWatch/AirPods

Lors de la conférence de lancement de nouveaux produits d'automne du 10 septembre, Apple a lancé de nouveaux produits tels que l'iPhone 16, les AirPods 4, l'Apple Watch Series 10, etc. Basés sur des puces auto-développées, ils ont réalisé un bond en avant majeur en termes de performances et ont entièrement intégré Apple Intelligence pour offrir aux utilisateurs une expérience intelligente sans précédent. Cet article est une couverture complète de l'événement de lancement des nouveaux produits d'automne d'Apple.

Voir le rapport complet :https://go.hyper.ai/H7P8X

3. Sensibilité améliorée par 56%, CUHK/Fudan/Yale et d'autres ont proposé conjointement une nouvelle méthode de détection d'homologues protéiques

Dans le processus de reconnaissance des protéines, l’identification de l’homologie de séquence protéique est l’une des tâches les plus importantes. Pour résoudre les problèmes de la recherche sur l'homologie des protéines à distance, basée sur des modèles de langage protéique et une technologie de récupération dense, Li Yu de l'Université chinoise de Hong Kong, en collaboration avec Sun Siqi, un jeune chercheur du Laboratoire des systèmes complexes intelligents de l'Université Fudan et du Laboratoire d'intelligence artificielle de Shanghai, et Mark Gerstein de l'Université Yale, ont proposé un cadre de détection d'homologie ultra-rapide et très sensible - le chercheur d'homologie dense. Cet article est une interprétation détaillée et un partage du document de recherche.

Voir le rapport complet :https://go.hyper.ai/vLAej

4. Sur la base de 2 500 kilomètres carrés de données réelles, l'équipe de l'Université normale de Pékin a proposé le modèle StarFusion pour obtenir une prédiction d'images à haute résolution spatiale.

L'équipe de Chen Jin du Laboratoire d'État des processus de surface terrestre et de l'écologie des ressources de l'Université normale de Pékin a proposé un modèle d'architecture de fusion découplée spatio-temporelle à double flux, StarFusion, qui peut surmonter le problème selon lequel la plupart des algorithmes d'apprentissage en profondeur existants nécessitent des images de séries chronologiques HSR pour la formation et réaliser pleinement la prédiction d'images à haute résolution spatiale. Cet article est une interprétation détaillée et un partage du document de recherche.

Voir le rapport complet :https://go.hyper.ai/7LmzA

Articles populaires de l'encyclopédie

1. Fonction sigmoïde

2. Test t apparié

3. Apprentissage contrastif

4. Apprentissage semi-supervisé

5. Augmentation des données

Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :

https://go.hyper.ai/wiki

Suivi unique des principales conférences universitaires sur l'IA :https://go.hyper.ai/event

À propos d'HyperAI

HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :

* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 300 ensembles de données publiques

* Comprend plus de 400 tutoriels en ligne classiques et populaires

* Interprétation de plus de 100 cas d'articles AI4Science

* Prise en charge de plus de 500 termes de recherche associés

* Hébergement de la première documentation complète d'Apache TVM en Chine

Visitez le site Web officiel pour commencer votre parcours d'apprentissage :

https://hyper.ai