HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Apprentissage profond en télédétection : une revue

Apprentissage profond en télédétection : une revue

Apprentissage Profond

Télédétection

Xiao Xiang Zhu, Devis Tuia, Lichao Mou, et al.

Une approche par régression pour l'amélioration de la parole basée sur les réseaux de neurones profonds

Une approche par régression pour l'amélioration de la parole basée sur les réseaux de neurones profonds

Traitement Audio Et Vocal

Apprentissage Profond

Yong Xu, Jun Du, Li-Rong Dai, et al.

Réseaux de neurones profonds pour la modélisation acoustique en reconnaissance vocale

Réseaux De Neurones

Traitement Audio Et Vocal

Geoffrey Hinton, Li Deng, Dong Yu, et al.

RoboTTT : Mise à l'échelle du contexte pour les politiques robotiques

Entraînement Du Modèle

Apprentissage Par Renforcement

Yunfan Jiang, Yevgen Chebotar, Ruijie Zheng, et al.

SWE-agent : les interfaces agent-ordinateur permettent l’automatisation de l’ingénierie logicielle

Génération De Code

John Yang, Carlos E. Jimenez, Alexander Wettig, et al.

Estimation efficace des représentations de mots dans l'espace vectoriel

Apprentissage Profond

Traitement Du Langage Naturel

Tomas Mikolov, Greg Corrado, Kai Chen, et al.

Prédiction de carte de profondeur à partir d'une image unique à l'aide d'un réseau profond multi-échelle

Estimation De Profondeur

Vision Par Ordinateur

David Eigen, Christian Puhrsch, Rob Fergus

TabNet : Apprentissage tabulaire interprétable par attention

Apprentissage Profond

Sercan O. Arık, Tomas Pfister

AudioPaLM : un grand modèle de langage capable de parler et d’écouter

Paul K. Rubenstein, Chulayuth Asawaroengchai, Duc Dung Nguyen, et al.

SQuAD : Plus de 100 000 questions pour la compréhension automatique de textes

Réponse Aux Questions Intelligente

Traitement Du Langage Naturel

Pranav Rajpurkar, Jian Zhang, Konstantin Lopyrev, et al.

DeepPose : Estimation de la pose humaine via des réseaux de neurones profonds

Apprentissage Profond

Vision Par Ordinateur

Alexander Toshev, Christian Szegedy

Auto-amélioration dans les systèmes agentiques modernes : une étude

Zhe Ren, Yimeng Chen, Dandan Guo, et al.

Optimisation asynchrone à déploiement unique pour l’apprentissage par renforcement agentique

Apprentissage Par Renforcement

Zhenyu Hou, Yujiang Li, Jie Tang, et al.

SparDA : attention découplée parcimonieuse pour une inférence efficace des LLM à long contexte

Yaosheng Fu, Guangxuan Xiao, Xin Dong, et al.

MetaView : Synthèse de nouvelles vues monoculaire avec des a priori géométriques implicites sensibles à l'échelle

Génération 3D

Modèle De Diffusion

Yufei Cai, Xuesong Niu, Hao Lu, et al.

PolicyShiftGuard : Évaluation et amélioration des garde-fous d’images adaptatifs aux politiques

Affinage Supervisé

Mingyang Song, Luxin Xu, Haoyu Sun, et al.

KnowAct-GUIClaw : Connaître en profondeur, agir parfaitement, assistant personnel GUI avec mémoire et compétences auto-évolutives

Yunxin Li, Jinchao Li, Baotian Hu, et al.

Rapport technique OvisOCR2

Compréhension De Document

Shiyin Lu, Yinglun Li, Yu Xia, et al.

Boogu-Image-0.1 : Améliorer la compréhension et la génération multimodales unifiées en open source

Texte Vers Image

Génération D'images

Rui Liu, Chao Huang, Han Shi, et al.

Manuel du harnais : rendre les harnais d'agents évolutifs lisibles, navigables et modifiables

Génération De Code

Ruhan Wang, Yucheng Shi, Zongxia Li, et al.

Rapport technique de Qwen-Music

Jin Xu, Shun Lei, Xueyao Zhang, et al.

Recâblage spectral pour l'exploration, la purification et la fusion de modèles

Apprentissage Profond

Zhilong Zhang, Hongli Yu, Huan-ang Gao, et al.

Repenser l'évaluation de l'évolution des harnais pour les agents

Yike Wang, Huaisheng Zhu, Zhengyu Hu, et al.

Ring-Zero : Mise à l'échelle du RL zéro à un billion de paramètres pour le raisonnement émergent

Apprentissage Par Renforcement

Xinyu Tang, Gangqiang Cao, Yurou Liu, et al.

Combler le fossé entre le raisonnement latent et explicite avec les Transformers en boucle

Ying Fan, Anej Svete, Kangwook Lee

Vers un développement autonome et vérifiable de modèles d’imagerie médicale

Imagerie Médicale

Shengyuan Liu, Jia-Xuan Jiang, Boyun Zheng, et al.

MUSCRIPTOR : UN MODÈLE OUVERT POUR LA TRANSCRIPTION MUSICALE MULTI-INSTRUMENT

Reconnaissance Vocale

Traitement Audio Et Vocal

Simon Rouard, Carl-Johann Simon-Gabriel, Michael Krause

Analyse principielle des paradigmes d'évaluation et de conception en apprentissage par renforcement profond

Apprentissage Par Renforcement

Apprentissage Profond

Savoir avant de corriger : acquisition de connaissances sur le dépôt guidée par questions-réponses pour la résolution de tickets logiciels

Génération De Code

Réponse Aux Questions Intelligente

Haotian Lin, Silin Chen, Xiaodong Gu, et al.

Blind-Spots-Bench : Évaluation des angles morts dans les modèles multimodaux

Matteo Santelmo, Xiuying Wei, Israa Fakih, et al.

Read It Back : Les MLLM préentraînés sont des modèles de récompense zero-shot pour la génération texte-image

Texte Vers Image

Modèle De Diffusion

Runhui Huang, Qihui Zhang, Zhe Liu, et al.

Le rôle de la rigueur en intelligence artificielle

Intelligence Artificielle

Apprentissage Profond

Apprentissage profond en télédétection : une revue

Apprentissage profond en télédétection : une revue

Apprentissage Profond

Télédétection

Xiao Xiang Zhu, Devis Tuia, Lichao Mou, et al.

Une approche par régression pour l'amélioration de la parole basée sur les réseaux de neurones profonds

Une approche par régression pour l'amélioration de la parole basée sur les réseaux de neurones profonds

Traitement Audio Et Vocal

Apprentissage Profond

Yong Xu, Jun Du, Li-Rong Dai, et al.

Réseaux de neurones profonds pour la modélisation acoustique en reconnaissance vocale

Réseaux De Neurones

Traitement Audio Et Vocal

Geoffrey Hinton, Li Deng, Dong Yu, et al.

RoboTTT : Mise à l'échelle du contexte pour les politiques robotiques

Entraînement Du Modèle

Apprentissage Par Renforcement

Yunfan Jiang, Yevgen Chebotar, Ruijie Zheng, et al.

SWE-agent : les interfaces agent-ordinateur permettent l’automatisation de l’ingénierie logicielle

Génération De Code

John Yang, Carlos E. Jimenez, Alexander Wettig, et al.

Estimation efficace des représentations de mots dans l'espace vectoriel

Apprentissage Profond

Traitement Du Langage Naturel

Tomas Mikolov, Greg Corrado, Kai Chen, et al.

Prédiction de carte de profondeur à partir d'une image unique à l'aide d'un réseau profond multi-échelle

Estimation De Profondeur

Vision Par Ordinateur

David Eigen, Christian Puhrsch, Rob Fergus

TabNet : Apprentissage tabulaire interprétable par attention

Apprentissage Profond

Sercan O. Arık, Tomas Pfister

AudioPaLM : un grand modèle de langage capable de parler et d’écouter

Paul K. Rubenstein, Chulayuth Asawaroengchai, Duc Dung Nguyen, et al.

SQuAD : Plus de 100 000 questions pour la compréhension automatique de textes

Réponse Aux Questions Intelligente

Traitement Du Langage Naturel

Pranav Rajpurkar, Jian Zhang, Konstantin Lopyrev, et al.

DeepPose : Estimation de la pose humaine via des réseaux de neurones profonds

Apprentissage Profond

Vision Par Ordinateur

Alexander Toshev, Christian Szegedy

Auto-amélioration dans les systèmes agentiques modernes : une étude

Zhe Ren, Yimeng Chen, Dandan Guo, et al.

Optimisation asynchrone à déploiement unique pour l’apprentissage par renforcement agentique

Apprentissage Par Renforcement

Zhenyu Hou, Yujiang Li, Jie Tang, et al.

SparDA : attention découplée parcimonieuse pour une inférence efficace des LLM à long contexte

Yaosheng Fu, Guangxuan Xiao, Xin Dong, et al.

MetaView : Synthèse de nouvelles vues monoculaire avec des a priori géométriques implicites sensibles à l'échelle

Génération 3D

Modèle De Diffusion

Yufei Cai, Xuesong Niu, Hao Lu, et al.

PolicyShiftGuard : Évaluation et amélioration des garde-fous d’images adaptatifs aux politiques

Affinage Supervisé

Mingyang Song, Luxin Xu, Haoyu Sun, et al.

KnowAct-GUIClaw : Connaître en profondeur, agir parfaitement, assistant personnel GUI avec mémoire et compétences auto-évolutives

Yunxin Li, Jinchao Li, Baotian Hu, et al.

Rapport technique OvisOCR2

Compréhension De Document

Shiyin Lu, Yinglun Li, Yu Xia, et al.

Boogu-Image-0.1 : Améliorer la compréhension et la génération multimodales unifiées en open source

Texte Vers Image

Génération D'images

Rui Liu, Chao Huang, Han Shi, et al.

Manuel du harnais : rendre les harnais d'agents évolutifs lisibles, navigables et modifiables

Génération De Code

Ruhan Wang, Yucheng Shi, Zongxia Li, et al.

Rapport technique de Qwen-Music

Jin Xu, Shun Lei, Xueyao Zhang, et al.

Recâblage spectral pour l'exploration, la purification et la fusion de modèles

Apprentissage Profond

Zhilong Zhang, Hongli Yu, Huan-ang Gao, et al.

Repenser l'évaluation de l'évolution des harnais pour les agents

Yike Wang, Huaisheng Zhu, Zhengyu Hu, et al.

Ring-Zero : Mise à l'échelle du RL zéro à un billion de paramètres pour le raisonnement émergent

Apprentissage Par Renforcement

Xinyu Tang, Gangqiang Cao, Yurou Liu, et al.

Combler le fossé entre le raisonnement latent et explicite avec les Transformers en boucle

Ying Fan, Anej Svete, Kangwook Lee

Vers un développement autonome et vérifiable de modèles d’imagerie médicale

Imagerie Médicale

Shengyuan Liu, Jia-Xuan Jiang, Boyun Zheng, et al.

MUSCRIPTOR : UN MODÈLE OUVERT POUR LA TRANSCRIPTION MUSICALE MULTI-INSTRUMENT

Reconnaissance Vocale

Traitement Audio Et Vocal

Simon Rouard, Carl-Johann Simon-Gabriel, Michael Krause

Analyse principielle des paradigmes d'évaluation et de conception en apprentissage par renforcement profond

Apprentissage Par Renforcement

Apprentissage Profond

Savoir avant de corriger : acquisition de connaissances sur le dépôt guidée par questions-réponses pour la résolution de tickets logiciels

Génération De Code

Réponse Aux Questions Intelligente

Haotian Lin, Silin Chen, Xiaodong Gu, et al.

Blind-Spots-Bench : Évaluation des angles morts dans les modèles multimodaux

Matteo Santelmo, Xiuying Wei, Israa Fakih, et al.

Read It Back : Les MLLM préentraînés sont des modèles de récompense zero-shot pour la génération texte-image

Texte Vers Image

Modèle De Diffusion

Runhui Huang, Qihui Zhang, Zhe Liu, et al.

Le rôle de la rigueur en intelligence artificielle

Intelligence Artificielle

Apprentissage Profond

Réseaux de neurones profonds pour la modélisation acoustique en reconnaissance vocale

RoboTTT : Mise à l'échelle du contexte pour les politiques robotiques

SWE-agent : les interfaces agent-ordinateur permettent l’automatisation de l’ingénierie logicielle

Estimation efficace des représentations de mots dans l'espace vectoriel

Prédiction de carte de profondeur à partir d'une image unique à l'aide d'un réseau profond multi-échelle

TabNet : Apprentissage tabulaire interprétable par attention

AudioPaLM : un grand modèle de langage capable de parler et d’écouter

SQuAD : Plus de 100 000 questions pour la compréhension automatique de textes

DeepPose : Estimation de la pose humaine via des réseaux de neurones profonds

Auto-amélioration dans les systèmes agentiques modernes : une étude

Optimisation asynchrone à déploiement unique pour l’apprentissage par renforcement agentique

SparDA : attention découplée parcimonieuse pour une inférence efficace des LLM à long contexte

MetaView : Synthèse de nouvelles vues monoculaire avec des a priori géométriques implicites sensibles à l'échelle

PolicyShiftGuard : Évaluation et amélioration des garde-fous d’images adaptatifs aux politiques

KnowAct-GUIClaw : Connaître en profondeur, agir parfaitement, assistant personnel GUI avec mémoire et compétences auto-évolutives

Rapport technique OvisOCR2

Boogu-Image-0.1 : Améliorer la compréhension et la génération multimodales unifiées en open source

Manuel du harnais : rendre les harnais d'agents évolutifs lisibles, navigables et modifiables

Rapport technique de Qwen-Music

Recâblage spectral pour l'exploration, la purification et la fusion de modèles

Repenser l'évaluation de l'évolution des harnais pour les agents

Ring-Zero : Mise à l'échelle du RL zéro à un billion de paramètres pour le raisonnement émergent

Combler le fossé entre le raisonnement latent et explicite avec les Transformers en boucle

Vers un développement autonome et vérifiable de modèles d’imagerie médicale

MUSCRIPTOR : UN MODÈLE OUVERT POUR LA TRANSCRIPTION MUSICALE MULTI-INSTRUMENT

Analyse principielle des paradigmes d'évaluation et de conception en apprentissage par renforcement profond

Savoir avant de corriger : acquisition de connaissances sur le dépôt guidée par questions-réponses pour la résolution de tickets logiciels

Blind-Spots-Bench : Évaluation des angles morts dans les modèles multimodaux

Read It Back : Les MLLM préentraînés sont des modèles de récompense zero-shot pour la génération texte-image

Le rôle de la rigueur en intelligence artificielle

Réseaux de neurones profonds pour la modélisation acoustique en reconnaissance vocale

RoboTTT : Mise à l'échelle du contexte pour les politiques robotiques

SWE-agent : les interfaces agent-ordinateur permettent l’automatisation de l’ingénierie logicielle

Estimation efficace des représentations de mots dans l'espace vectoriel

Prédiction de carte de profondeur à partir d'une image unique à l'aide d'un réseau profond multi-échelle

TabNet : Apprentissage tabulaire interprétable par attention

AudioPaLM : un grand modèle de langage capable de parler et d’écouter

SQuAD : Plus de 100 000 questions pour la compréhension automatique de textes

DeepPose : Estimation de la pose humaine via des réseaux de neurones profonds

Auto-amélioration dans les systèmes agentiques modernes : une étude

Optimisation asynchrone à déploiement unique pour l’apprentissage par renforcement agentique

SparDA : attention découplée parcimonieuse pour une inférence efficace des LLM à long contexte

MetaView : Synthèse de nouvelles vues monoculaire avec des a priori géométriques implicites sensibles à l'échelle

PolicyShiftGuard : Évaluation et amélioration des garde-fous d’images adaptatifs aux politiques

KnowAct-GUIClaw : Connaître en profondeur, agir parfaitement, assistant personnel GUI avec mémoire et compétences auto-évolutives

Rapport technique OvisOCR2

Boogu-Image-0.1 : Améliorer la compréhension et la génération multimodales unifiées en open source

Manuel du harnais : rendre les harnais d'agents évolutifs lisibles, navigables et modifiables

Rapport technique de Qwen-Music

Recâblage spectral pour l'exploration, la purification et la fusion de modèles

Repenser l'évaluation de l'évolution des harnais pour les agents

Ring-Zero : Mise à l'échelle du RL zéro à un billion de paramètres pour le raisonnement émergent

Combler le fossé entre le raisonnement latent et explicite avec les Transformers en boucle

Vers un développement autonome et vérifiable de modèles d’imagerie médicale

MUSCRIPTOR : UN MODÈLE OUVERT POUR LA TRANSCRIPTION MUSICALE MULTI-INSTRUMENT

Analyse principielle des paradigmes d'évaluation et de conception en apprentissage par renforcement profond

Savoir avant de corriger : acquisition de connaissances sur le dépôt guidée par questions-réponses pour la résolution de tickets logiciels

Blind-Spots-Bench : Évaluation des angles morts dans les modèles multimodaux

Read It Back : Les MLLM préentraînés sont des modèles de récompense zero-shot pour la génération texte-image

Le rôle de la rigueur en intelligence artificielle