Choix Hebdomadaires De L'éditeur | Alternative Gratuite À Sora, Tutoriel De Base Python En Ligne, Lancement Du Jeu De Données De Détection Des Fausses Nouvelles Chinoises MCFEND

Après ChatGPT, OpenAI a publié un autre produit explosif : le modèle vidéo Sora. Alors que d'autres modèles peinent encore à résoudre le problème de continuité en quelques secondes, Sora a déjà étendu la durée de la vidéo à 60 secondes. Cependant, le modèle Sora n’est actuellement accessible qu’à un petit groupe de chercheurs et de créatifs.
Ne vous inquiétez pas, HyperAI vous fournit une solution vidéo open source générée par l'IA :Combinaison Diffusion stable + Voyage rapide + AnimateDiff, démarrage en un clic, utilisation gratuite !Profitez d'un festin visuel en 1 seconde, l'alternative open source de Sora vous attend ! Des tutoriels d'utilisation en ligne sont désormais disponibles sur le site officiel hyper.ai, venez en faire l'expérience !
Du 25 au 29 mars, le site officiel hyper.ai est mis à jour :
* Ensembles de données publiques de haute qualité : 10
* Tutoriels sélectionnés de haute qualité : 2
* Sélection d'articles communautaires : 4 articles
* Entrées d'encyclopédie populaire : 5
Visitez le site officiel :hyper.ai
Ensembles de données publiques sélectionnés
1. MCFEND Un ensemble de données de référence multi-sources pour la détection des fausses nouvelles en Chine
L'ensemble de données MCFEND est un ensemble de données de référence de détection de fausses nouvelles chinoises multi-sources construit conjointement par l'Université baptiste de Hong Kong, l'Université chinoise de Hong Kong et d'autres institutions. L'ensemble de données recueille 23 974 éléments d'actualité provenant de diverses sources telles que les plateformes sociales, les applications de messagerie instantanée et les médias d'information en ligne traditionnels, qui ont tous été vérifiés par 14 organisations internationales de vérification des faits faisant autorité.
Utilisation directe :
2. Fin-Eva Version 1.0 Kit d'évaluation de données professionnelles en langue chinoise dans le domaine financier
L'ensemble de données Fin-Eva Version 1.0 est un ensemble de données d'évaluation financière lancé conjointement par Ant Group et l'Université de finance et d'économie de Shanghai. Il couvre plusieurs scénarios financiers tels que la gestion de patrimoine, l'assurance, la recherche en investissement et lance des disciplines professionnelles financières, avec un nombre total de questions d'évaluation dépassant 13 000.
Utilisation directe :
3. Ensemble de données de conversion de texte en vidéo à grande échelle VidProM
L'ensemble de données VidProM est le premier ensemble de données d'invite texte-vidéo à grande échelle pour utilisateurs réels développé conjointement par l'Université de technologie de Sydney et l'Université du Zhejiang. Il contient 1,67 million d'invites texte-vidéo uniques et 6,69 millions de vidéos générées par quatre modèles de diffusion de pointe.
Utilisation directe :
4. Ensemble de données de reconnaissance d'émotions d'images FindingEmo
FindingEmo est un nouvel ensemble de données d'images créé par la KU Leuven et d'autres institutions spécifiquement pour les tâches de reconnaissance des émotions. L'ensemble de données contient des annotations pour 25 000 images.
Utilisation directe :
5. Ensemble de données GPD sur le flux de foule et la vitesse du trafic
La dernière réalisation du Centre de recherche en sciences urbaines et en informatique, Département de génie électronique, Université Tsinghua, « Apprentissage spatio-temporel en quelques coups via la génération de réseaux neuronaux diffusifs », a été acceptée par ICLR2024. L’étude a proposé le modèle GPD (Generative Pre-Trained Diffusion) pour réaliser un apprentissage spatio-temporel dans des scénarios à données rares. Cet ensemble de données est constitué des données et du code open source de l'article.
Utilisation directe :
6. Ensemble de données de puzzle d'algorithme multimodal AlgoPuzzleVQA
L'ensemble de données AlgoPuzzleVQA est un ensemble de données de raisonnement multimodal construit par l'Université de technologie et de design de Singapour pour défier et évaluer la capacité des modèles de langage multimodaux à résoudre des énigmes algorithmiques qui nécessitent une compréhension visuelle, une compréhension du langage et un raisonnement algorithmique complexe.
Utilisation directe :
7. Ensemble de données d'évaluation de la sécurité du grand modèle UltraSafety
L'ensemble de données UltraSafety a été créé conjointement par l'Université Renmin de Chine, l'Université Tsinghua et Tencent pour évaluer et améliorer la sécurité des grands modèles. L'ensemble de données est dérivé de 1 000 instructions de semences sécurisées d'AdvBench et de MaliciousInstruct, et 2 000 autres instructions sont amorcées à l'aide de Self-Instruct.
Utilisation directe :
8. NAIP-S2 États-UnisEnsemble national de données de télédétection à super-résolution
NAIP-S2 est un ensemble de données de télédétection à super-résolution publié par l'Allen Institute for Artificial Intelligence qui contient des images NAIP et Sentinel-2 appariées sur les États-Unis continentaux. Cet ensemble de données a de nombreuses applications dans le domaine de la science de la télédétection, en particulier dans la surveillance de surface, la gestion des ressources et l'évaluation des changements environnementaux, fournissant un support de données de haute précision.
Utilisation directe :
9. Ensemble de données d'intelligence sur la culture et la langue coréennes CLicK
L'ensemble de données CLIcK a été créé par l'Institut coréen avancé des sciences et technologies pour combler le vide dans l'évaluation des connaissances culturelles et linguistiques pour les grands modèles coréens. L'ensemble de données contient 1 995 paires questions-réponses dérivées des examens et manuels officiels coréens, couvrant deux catégories : la langue et la culture, qui sont divisées en 11 sous-catégories. Chaque échantillon fournit des annotations détaillées indiquant les connaissances culturelles et linguistiques requises pour répondre à la question.
Utilisation directe :
10. Données utilisées dans la recherche TacticAI
Cet ensemble de données contient les données pertinentes collectées dans le cadre de la recherche « TacticAI : Football Tactical Artificial Intelligence Assistant ».
Utilisation directe :
Pour plus d'ensembles de données publics, veuillez visiter:
Tutoriels publics sélectionnés
1. Générer des nombres aléatoires en Python
Les vrais nombres aléatoires sont difficiles à obtenir dans les ordinateurs car ceux-ci ne peuvent effectuer que des opérations spécifiques. Le pseudo-aléatoire est possible et peut être simulé par programmation. Ce tutoriel vous montrera étape par étape comment générer des nombres aléatoires en Python.
Exécutez en ligne :
2. Développer des réseaux neuronaux étape par étape avec PyTorch
PyTorch est une puissante bibliothèque Python permettant de créer des modèles d'apprentissage en profondeur qui simplifient le processus de définition, de formation et d'inférence sur les réseaux neuronaux. Ce tutoriel vous montrera comment charger un ensemble de données CSV, définir un modèle de perceptron multicouche, l'entraîner et l'évaluer dans PyTorch, en fournissant des conseils pour créer un modèle de réseau neuronal d'apprentissage en profondeur.
Exécutez en ligne :
Articles de la communauté
Ce tutoriel est une combinaison de la solution open source de génération de vidéos AI Stable Diffusion + Prompt Travel + AnimateDiff, qui est gratuite pour tout le monde. Démarrez l'alternative open source de Sora en un clic et profitez du festin visuel en 1 seconde.
Exécutez en ligne :
L'équipe du professeur Liu Shao du département de pharmacie de l'hôpital Xiangya de l'université du centre-sud a établi un cadre de réseau moléculaire intégré (IMN4NPD) qui peut explorer de manière exhaustive les composants pharmacologiques des médicaments naturels. Il accélère non seulement la déréplication de clusters étendus dans les réseaux moléculaires, mais fournit également des annotations pour les boucles automatiques et les nœuds appariés qui sont souvent négligés dans les méthodes de recherche existantes. Les résultats pertinents ont été publiés dans la revue « Bioinformatics ».
Voir le rapport complet :
Des chercheurs de l'Université Centrale du Sud ont proposé une méthode appelée AdaDR, qui effectue le repositionnement des médicaments en intégrant en profondeur les caractéristiques des nœuds et les structures topologiques, et simule les informations interactives entre elles sur la base d'opérations de convolution de graphes adaptatives, améliorant ainsi la puissance expressive du modèle. L'article pertinent a été publié dans « American Chemical Society ».
Voir le rapport complet :
Les coups de pied de coin sont souvent une excellente occasion de mettre en œuvre des tactiques d’entraînement. En réponse à cela, Google DeepMind et le Liverpool Football Club ont lancé conjointement TacticAI, qui utilise des méthodes d'apprentissage profond géométrique et des modèles prédictifs et génératifs pour fournir aux professionnels des informations tactiques sur les coups de pied de coin. Les résultats de l’étude montrent que la disposition tactique proposée par TacticAI est favorisée par les évaluateurs experts humains dans tous les cas de 90%. La précision de la prédiction de réception de balle est aussi élevée que 74%, et les chances de tir sont augmentées de 13%. Les résultats pertinents ont été publiés dans la revue « Nature ».
Voir le rapport complet :
Articles populaires de l'encyclopédie
1. Test t apparié
2. Apprentissage par représentation
3. Codage de position rotationnelle RoPE
4. Recherche cognitive
5. Raisonnement basé sur des cas (RBC)
Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :
Aperçu de la diffusion en direct de la station B
date | temps | contenu |
1er avril Lundi | 10:00 | Cours CS50 de Harvard (2023) |
Mardi 2 avril | 10:00 | Cours CS50 de Harvard (2022) |
Mercredi 3 avril | 10:00 | Cours d'apprentissage profond du MIT |
Jeudi 4 avril | 10:00 | Les conférences de presse de NVIDIA au fil des ans |
Vendredi 5 avril | 10:0018:00 | Cours de compilation sur l'apprentissage automatique Journée de l'IA Tesla |
Samedi 6 avril | 10:00 | Conférences Google IO au fil des ans |
7 avril Dimanche | 10:00 | Symposium HAI de Stanford |
Super Neuro TV diffuse en direct 24h/24 et 7j/7. Cliquez pour obtenir les « cornichons électroniques » dans le domaine de l'IA :
http://live.bilibili.com/26483094
Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !
À la semaine prochaine !
À propos d'HyperAI
HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :
* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques
* Comprend plus de 300 tutoriels en ligne classiques et populaires
* Interprétation de plus de 100 cas d'articles AI4Science
* Prise en charge de plus de 500 termes de recherche associés
* Hébergement de la première documentation complète d'Apache TVM en Chine
Visitez le site Web officiel pour commencer votre parcours d'apprentissage :