HyperAI

Choix Hebdomadaires De L'éditeur | Exécution Du Modèle Financier Deepmoney En Ligne, Préférences D'ia Et Autres Ensembles De Données De Haute Qualité En Ligne

特色图像

À l’heure actuelle, la plupart des résultats de recherche sur les modèles financiers dans le domaine de l’IA sont basés sur des connaissances publiques. Cependant, dans la pratique financière réelle, l’interprétabilité de ces connaissances publiques pour le marché actuel est souvent gravement insuffisante. Un modèle financier idéal devrait être capable de comprendre les événements d’actualité ou de données et de les évaluer instantanément à partir de perspectives subjectives et quantitatives.
Deepmoney a été créé à cet effet. Il s’agit d’un projet de modèle linguistique à grande échelle axé sur l’investissement dans le domaine financier. Le site officiel hyper.ai propose désormais des tutoriels d'utilisation en ligne, venez en faire l'expérience !

Du 18 au 22 mars, le site officiel hyper.ai est mis à jour :

* Ensembles de données publiques de haute qualité : 10

* Sélection de tutoriels de haute qualité : 3

* Sélection d'articles communautaires : 3 articles

* Entrées d'encyclopédie populaire : 10

Visitez le site officiel :hyper.ai

Ensembles de données publiques sélectionnés

1. OpenHermesPreferences : ensemble de données sur les préférences de l'IA L'ensemble de données OpenHermesPreferences a été créé par Argilla en collaboration avec l'équipe Hugging Face H4 et contient environ 1 million de données de préférences IA. Cet ensemble de données peut être utilisé pour former des modèles de préférences ou pour aligner des modèles linguistiques via des techniques telles que l'optimisation directe des préférences.

Utilisation directe :

https://my5353.com/30168

2. Ensemble de données d'alignement de contexte long pour grand modèle LongAlign 10K

LongAlign-10k est un ensemble de données proposé par l'Université Tsinghua pour relever les défis auxquels sont confrontés les grands modèles dans les tâches d'alignement à long contexte. Il contient 10 000 données d'instructions longues d'une longueur comprise entre 8 Ko et 64 Ko. L'ensemble de données est conçu pour évaluer les performances de grands modèles dans des contextes longs et leur capacité à suivre des instructions de tâches d'une longueur de 10 000 à 100 000.

Utilisation directe :

https://my5353.com/30247

3. Ensemble de données d'évaluation de la cybersécurité du grand modèle CyberMetric

L'ensemble de données CyberMetric contient 10 000 questions conçues pour évaluer de manière exhaustive les connaissances en cybersécurité des grands modèles. L'ensemble de données a été créé à l'aide de différents grands modèles et validé par des experts du domaine de la cybersécurité pour garantir sa pertinence et son exactitude.

Utilisation directe :

https://my5353.com/30251

4. Ensemble de données cartographiques à l'échelle nationale de la centrale photovoltaïque terrestre de 10 m de Chine 2020

L'Université agricole de Chine, en collaboration avec l'Institut des sciences géographiques et de recherche sur les ressources naturelles de l'Académie chinoise des sciences, a développé une méthode de cartographie nationale pour remédier au manque de données open source à haute résolution sur la répartition des centrales photovoltaïques terrestres nationales en Chine. Ils ont publié avec succès l'ensemble de données de classification des centrales photovoltaïques au sol nationales de 10 mètres de résolution 2020. Cette réalisation révèle non seulement avec précision les caractéristiques de distribution spatiale des centrales photovoltaïques de mon pays, mais fournit également des ressources de données précieuses pour la planification énergétique, l'utilisation des terres, la surveillance par télédétection et la recherche environnementale avec une précision de classification de 89%. Cette initiative comble le manque de données dans ce domaine en Chine et revêt une grande importance pour la recherche connexe.

Utilisation directe :

https://my5353.com/30283

5. Classification des maladies des cultures Ensemble de données d'images de classification des maladies des cultures

L'ensemble de données contient des images classées de cinq maladies des cultures, qui ont été étiquetées comme suit : flétrissement bactérien du manioc (CBB), maladie des stries brunes du manioc (CBSD), maladie de la marbrure verte du manioc (CGM), maladie de la mosaïque du manioc (CMD) et saine. Il peut être utilisé pour former des modèles d’apprentissage automatique afin de détecter les maladies des plantes ou pour développer des algorithmes de diagnostic automatisé des plantes.

Utilisation directe :

https://my5353.com/30293

6. Détection des maladies des feuilles de tomate Ensemble de données de détection d'images des maladies des feuilles de tomate

Cet ensemble de données est un ensemble de données de détection d'images de maladies des feuilles de tomate. Les images sont divisées dans les catégories suivantes : sain, tache bactérienne, mildiou précoce, sain, mildiou tardif, moisissure des feuilles, point cible et tache noire. Les images sont annotées au format YOLO v5 PyTorch.

Utilisation directe :

https://my5353.com/30306

7. AVIS AMAZON 2023 : vaste ensemble de données d'avis Amazon

AMAZON REVIEWS 2023 est un ensemble de données d'avis Amazon à grande échelle collecté par McAuley Lab en 2023, contenant plus de 570 millions d'avis et 48 millions de produits, couvrant 33 catégories différentes.

Utilisation directe :

https://my5353.com/30267

8. Ensemble de données de falsification faciale générées par le modèle de diffusion DiFF

DiFF est un ensemble de données d'images de falsification faciale de haute qualité et à grande échelle développé conjointement par l'Université du Shandong, l'Université nationale de Singapour et d'autres institutions. Il est généré sur la base du modèle de diffusion et contient plus de 500 000 images. Cet ensemble de données convient à la détection de falsification faciale, aux attaques adverses et aux défenses contre les deep fakes, ainsi qu'à d'autres formations à des tâches de vision par ordinateur connexes.

Utilisation directe :

https://my5353.com/30260

9. Ensemble de données de dialogue de reconnaissance d'intention multimodale MIntRec2.0

MIntRec2.0 est un ensemble de données de référence multimodales à grande échelle proposé par l'Université Tsinghua et d'autres, qui est spécifiquement utilisé pour identifier l'intention dans les conversations et détecter le contenu non intentionnel. Par rapport au MIntRec précédent, le volume de données de MIntRec2.0 a augmenté à 15 000, couvrant 30 catégories d'intention, et contient environ 9,3 000 phrases annotées intentionnellement et 5,7 000 phrases annotées hors intention, impliquant plusieurs modalités telles que le texte, la vidéo et l'audio.

Utilisation directe :

https://my5353.com/30166

10. Ensemble de données médicales multilingues ApolloCorpora

ApolloCorpora est un ensemble de données médicales multilingue construit conjointement par le Shenzhen Big Data Research Institute et l'équipe de recherche de l'Université chinoise de Hong Kong. L'ensemble de données couvre six langues principales parlées par 6,1 milliards de personnes dans le monde, dont l'anglais, le chinois, l'hindi, l'espagnol, le français et l'arabe.

Utilisation directe :

https://my5353.com/30285

Pour plus d'ensembles de données publics, veuillez visiter:

https://hyper.ai/datasets

Tutoriels publics sélectionnés

1. Exécutez Deepmoney-34b-full en ligne

Deepmoney est un projet de modèle de langage à grande échelle axé sur les investissements dans le domaine financier. Deepmoney-34b-full est formé sur la base du modèle open source Yi-34B-200K 01-ai, qui est divisé en deux étapes : pt (formation complète des paramètres) et sft (réglage fin de Lora). Il peut désormais être cloné et utilisé en un clic sur le site officiel de Super Neuro.

Exécutez en ligne :

https://my5353.com/t30314

2. Exécutez Deepmoney-miqu-70b en ligne

Ce modèle est formé sur la base du miqu-1-70b-sf de huggingface.co, avec uniquement SFT (réglage fin Lora) effectué. Il peut désormais être cloné et utilisé en un clic sur le site officiel de SuperNeural.

Exécutez en ligne :

https://my5353.com/t30314

3. Exécutez Deepmoney-67b-full en ligne

Le modèle est formé sur la base de deepseek-llm-67b-base open source par deepseek-ai. Il est divisé en deux étapes : pt (formation lora) et sft (formation lora). Il peut désormais être cloné et utilisé en un clic sur le site officiel de SuperNeural.

Exécutez en ligne :

https://my5353.com/t30310

Articles de la communauté

1. NVIDIA Huang Renxun a lancé GB200, qui a une capacité de raisonnement 30 fois supérieure à celle du H100 et une consommation d'énergie 25 fois inférieure, transformant les capacités AI4S en microservices

La conférence GTC AI 2024 de cette année s'est déroulée comme prévu. Du 18 au 21 mars, plus de 900 réunions et plus de 20 conférences techniques ont eu lieu. Cet article est un résumé du discours d’ouverture de Jensen Huang au GTC.

Voir le rapport complet :

https://my5353.com/p30224

2. En générant 120 000 matériaux candidats à la capture du carbone en 33 minutes, le Laboratoire national d'Argonne publie un cadre d'IA générative pour accélérer l'innovation des MOF

Une équipe de recherche du laboratoire national d'Argonne aux États-Unis a proposé un cadre d'IA génératif GHP-MOFsassemble, qui peut générer et assembler de manière aléatoire de nouvelles structures MOF, filtrer des structures MOF hautement stables via des simulations de dynamique moléculaire et utiliser des réseaux neuronaux à graphes cristallins (CGCNN) et des simulations Monte Carlo grand canoniques (GCMC) pour tester la capacité d'adsorption des MOF pour le dioxyde de carbone. L'article correspondant a été publié dans « Nature ».

Voir le rapport complet :

https://my5353.com/p30269

3. L'Université de Princeton lance un contrôleur d'IA qui prédit le risque de déchirure du plasma 300 millisecondes à l'avance

Des chercheurs de l'Université de Princeton ont développé un contrôleur d'IA pour la prédiction et le contrôle adaptatifs qui peut prédire le risque potentiel de déchirure du plasma 300 millisecondes à l'avance et intervenir à temps. Les résultats pertinents ont été publiés dans « Nature ».

Voir le rapport complet :

https://my5353.com/p30296

Articles populaires de l'encyclopédie

1. Gravité des données

2. Compréhension massive du langage multitâche (MMLU)

3. Mélange d'experts (MoE)

4. Réseau neuronal quantique

5. Champ de rayonnement neuronal (NeRF)

Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :

https://hyper.ai/wiki

Aperçu de la diffusion en direct de la station B

datetempscontenu
25 mars
Lundi
10:0017:00Cours d'apprentissage en profondeur du MIT 2020Cours d'apprentissage en profondeur du MIT 2021
Mardi 26 mars10:00Développement d'API Python – Cours complet pour débutants
Mercredi 27 mars10:0014:00Tutoriel SQL - Cours pour débutants : IA générative, cours complet
Jeudi 28 mars21:00Cours Flutter pour débutants
Vendredi 29 mars10:00Cours Flutter pour débutants
Samedi 30 mars10:00Harvard CS50 — Cours d'intelligence artificielle Python
Dimanche 31 mars10:00Apprenez PyTorch pour l'apprentissage profond en une journée

Super Neuro TV diffuse en direct 24h/24 et 7j/7. Cliquez pour obtenir les « cornichons électroniques » dans le domaine de l'IA :

http://live.bilibili.com/26483094

Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !

À la semaine prochaine !

À propos d'HyperAI

HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :

* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques

* Comprend plus de 300 tutoriels en ligne classiques et populaires

* Interprétation de plus de 100 cas d'articles AI4Science

* Prise en charge de plus de 500 termes de recherche associés

* Hébergement de la première documentation complète d'Apache TVM en Chine

Visitez le site Web officiel pour commencer votre parcours d'apprentissage :

https://hyper.ai/