HyperAIHyperAI

Command Palette

Search for a command to run...

Un Modèle De Détection De Confidentialité Exécutable Localement : Privacy Filter Assure Un Filtrage Des Données Personnelles De Haute Qualité À Faible Coût ; Entièrement Open Source ! Compatible Avec L’ensemble De Données Structurées Transfermarkt Contenant Plus De 80 000 Matchs De football.

Featured Image

Privacy Filter est un modèle de classification bidirectionnel étiqueté open source développé par OpenAI pour le nettoyage de données à haut débit. Il permet de détecter et de masquer efficacement les informations personnelles identifiables (IPI) dans un texte. Basé sur une architecture pré-entraînée légère, similaire à gpt-oss, il abandonne la méthode traditionnelle de génération mot par mot. Au lieu de cela, il décode directement des segments cohérents de la séquence d'entrée par une unique propagation avant, combinée à l'algorithme de Viterbi contraint.

Actuellement, le site web HyperAI a lancé [la section/fonctionnalité concernée].Modèle de filtre de confidentialitéVenez l'essayer !

Utilisation en ligne :https://go.hyper.ai/Py1l3

Aperçu rapide des mises à jour du site web officiel d'hyper.ai du 25 au 30 avril :

* Jeux de données publics de haute qualité : 5

* Une sélection de tutoriels de haute qualité : 5

* Analyse d'un article de la communauté : 1 article

* Entrées d'encyclopédie populaire : 5

Visitez le site officiel :hyper.ai

Ensembles de données publiques sélectionnés

1. Ensemble de données Transfermarkt Football

Transfermarkt Football est un ensemble de données structuré sur le marché des transferts de football, hébergé sur le site web Transfermark et conçu pour l'analyse sportive et la modélisation des données. Cet ensemble de données contient plus de 80 000 matchs de football, 400 clubs et plus de 37 000 joueurs, enregistrant les variations de leur valeur marchande, leurs apparitions et leur activité de transfert.

Utilisation en ligne :https://go.hyper.ai/lF661

2. Entraînement au yoga : Classification des postures de yoga et ensemble de données d’entraînement

Yoga Training est un ensemble de données pour la classification des postures de yoga, principalement utilisé pour la classification d'images, la reconnaissance de postures, l'entraînement léger de modèles d'apprentissage profond et les expériences d'apprentissage par transfert. Cet ensemble contient 1 771 images d'exemples de postures de yoga, couvrant un large éventail de niveaux de difficulté et de catégories de postures.

Utilisation en ligne :https://go.hyper.ai/hVdM8

3. Base de données sur les maladies des feuilles de maïs

Le jeu de données Corn Leaf Diseases est composé d'images de feuilles de maïs conçues spécifiquement pour la détection de cibles en agriculture de précision. Il contient 4 027 images de feuilles de maïs, réparties en quatre catégories : feuilles saines et trois maladies courantes : la rouille, la tache grise et le flétrissement.

Utilisation en ligne :https://go.hyper.ai/UbRRp

4. Ensemble de données sur les maladies des feuilles de pommier

Apple Leaf Diseases est un jeu de données d'images de feuilles de pommier de haute qualité, spécialement conçu pour la détection de cibles en agriculture de précision. Ce jeu de données contient 3 444 images de feuilles de pommier, réparties en quatre catégories : feuilles saines et trois maladies courantes : la pourriture noire, la rouille du cèdre et la tavelure.

Utilisation en ligne :https://go.hyper.ai/LDafw

5. Ensemble de données sur la détection des effets indésirables des médicaments

Le jeu de données textuelles Drug Adverse Event Detection simule des situations réelles impliquant la prescription de plusieurs médicaments à un même patient. Il vise à étudier le risque d'effets indésirables liés à l'utilisation combinée de plusieurs médicaments et trouve de nombreuses applications dans la détection de ces effets, l'extraction d'informations médicales, l'analyse de textes cliniques et l'entraînement de modèles d'IA médicale.

Utilisation en ligne :https://go.hyper.ai/AlL32

Tutoriels publics sélectionnés

1. Modèle de filtre de confidentialité

OpenAI Privacy Filter est un modèle de classification de jetons bidirectionnel publié par OpenAI en avril 2026. Il permet de détecter et de masquer les informations personnelles identifiables (IPI) dans les textes. Ce modèle adopte une architecture similaire à celle de gpt-oss, mais à plus petite échelle. Sa fiche technique indique qu'il possède environ 1,5 milliard de paramètres au total, dont environ 50 millions actifs, qu'il prend en charge jusqu'à 128 000 contextes de jetons et qu'il définit les limites des fragments de confidentialité grâce à 33 étiquettes BIOES au niveau des jetons.

Exécutez en ligne :https://go.hyper.ai/Py1l3

Page de démonstration

2. Tutoriel d'utilisation d'Hermes

Hermes Agent est un agent d'IA open source et auto-évolutif, développé par l'équipe de Nous Research en 2026. L'une des caractéristiques principales de ce projet est sa boucle d'apprentissage intégrée : il crée automatiquement des compétences à partir de l'expérience acquise, s'améliore continuellement lors de son utilisation, stocke proactivement ses connaissances dans son système de mémoire et peut consulter l'historique des conversations pour acquérir progressivement une compréhension approfondie de l'utilisateur. Ce site web propose des tutoriels pour exécuter Hermes sur GPU et CPU.

Version GPU en cours d'exécution en ligne :https://go.hyper.ai/nnyFT

Version CPU en ligne :https://go.hyper.ai/kdo9i

Page de démonstration

3. Déploiement en un clic de DeepSeek-V4-Flash

DeepSeek V4 est la dernière génération de modèles de langage de grande taille développée par l'équipe DeepSeek. Elle comprend deux versions : DeepSeek-V4-Pro (1,6 T) et DeepSeek-V4-Flash (285 milliards de paramètres). DeepSeek V4 intègre un mécanisme d'attention contextuelle long et performant, prenant en charge nativement des contextes allant jusqu'à un million de jetons. Elle est spécialement conçue pour le traitement de textes très longs.

Exécutez en ligne :https://go.hyper.ai/sFyxU

Page de démonstration

4. Déployer MOSS-TTS-Nano en utilisant FreeCPU

MOSS-TTS-Nano est un modèle de synthèse vocale multilingue de 100 millions de paramètres, publié par l'équipe OpenMOSS en avril 2026. Il prend en charge la génération et le clonage de la parole dans un environnement CPU. Ce modèle est conçu pour offrir un équilibre optimal entre le naturel de la synthèse vocale, la compatibilité multilingue et la capacité de transfert de timbre à partir de données audio de référence, ce qui lui permet de couvrir un large éventail de tâches courantes, de la simple lecture à voix haute au clonage vocal.

Exécutez en ligne :https://go.hyper.ai/CwMEH

Page de démonstration

Interprétation des articles communautaires

1. En utilisant l'apprentissage d'ensembles empilés, une équipe de recherche britannique a réussi à prédire avec une grande précision l'indice sismique de 251 étoiles Delta Scuti.

Une équipe de recherche de l'Université de Warwick, au Royaume-Uni, a développé un cadre d'apprentissage par ensembles empilés pour prédire directement les principaux paramètres astérosismologiques des étoiles Delta Scuti à partir des courbes de lumière de TESS. Cette méthode a obtenu des résultats remarquables sur un échantillon de 643 étoiles : le coefficient de détermination (R²) pour tous les paramètres cibles était supérieur à 0,77, et elle a démontré une bonne capacité de généralisation sur 60 étoiles non utilisées lors de l'entraînement. Les résultats de la prédiction étaient très cohérents avec l'analyse astérosismologique traditionnelle.

Voir le rapport complet :https://go.hyper.ai/mNGlM

Articles populaires de l'encyclopédie

1. Compétences

2. Hyperréseaux

3. Fonction sigmoïde

4. Fusion de rangs réciproques

5. Architecture multi-agents

Voici des centaines de termes liés à l'IA compilés pour vous aider à comprendre « l'intelligence artificielle » ici :

https://go.hyper.ai/wiki

Voici tout le contenu de la sélection de l’éditeur de cette semaine. Si vous avez des ressources que vous souhaitez inclure sur le site officiel hyper.ai, vous êtes également invités à laisser un message ou à soumettre un article pour nous le dire !

À la semaine prochaine !

À propos d'HyperAI

HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :

* Fournit des nœuds de téléchargement accéléré nationaux pour plus de 2100 jeux de données publics

* Comprend plus de 700 tutoriels en ligne classiques et populaires

* Analyse de plus de 300 études de cas sur l'IA au service de la science

* Permet de rechercher plus de 700 termes associés

* Hébergement de la première documentation complète d'Apache TVM en Chine

Visitez le site Web officiel pour commencer votre parcours d'apprentissage :

https://hyper.ai