HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Robix : un modèle unifié pour l'interaction, le raisonnement et la planification robotiques

Robix : un modèle unifié pour l'interaction, le raisonnement et la planification robotiques

Intelligence Incarnée

Huang Fang, Mengxi Zhang, Heng Dong, et al.

Test d’intrusion des modèles linguistiques pour réduire les préjudices : méthodes, comportements d’échelle et leçons tirées

Test d’intrusion des modèles linguistiques pour réduire les préjudices : méthodes, comportements d’échelle et leçons tirées

Modélisation Des Préférences

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.

FusionProt : Fusionner les informations séquentielles et structurales pour un apprentissage unifié de la représentation des protéines

Représentation Multimodale

Dan Kalifa, Uriel Singer, Kira Radinsky

LimiX : Libérer le potentiel de modélisation des données structurées pour une intelligence généraliste

Apprentissage Multi-tâches

Xingxuan Zhang, Gang Ren, Han Yu, et al.

epiGPTope : un générateur et classificateur d’épitopes basé sur l’apprentissage automatique

IA Pour La Science

Apprentissage Profond

Natalia Flechas Manrique, Alberto Martínez, Elena López-Martínez, et al.

GenCompositor : composition vidéo générative avec Transformer à diffusion

Génération De Vidéo

Traitement Vidéo

Shuzhou Yang, Xiaoyu Li, Xiaodong Cun, et al.

DCPO : Optimisation dynamique de la politique de découpage

Apprentissage Par Renforcement

Shihui Yang, Chengfeng Dou, Peidong Guo, et al.

Vecteurs de raisonnement : Transfert de capacités de chaîne de raisonnement par arithmétique de tâches

Mohammad Zbeeb, Hasan Abed Al Kader Hammoud, Bernard Ghanem

Baichuan-M2 : Augmenter les capacités médicales grâce à un système de vérification à grande échelle

Baichuan-M2 Team, Chengfeng Dou, Chong Liu, et al.

VerlTool : Vers un apprentissage par renforcement agissant holistique intégrant l'utilisation d'outils

Dongfu Jiang, Yi Lu, Zhuofeng Li, et al.

ELV-Halluc : Évaluation des hallucinations d'agrégation sémantique dans la compréhension des vidéos longues

Hao Lu, Jiahao Wang, Yaolun Zhang, et al.

MedChatZH : un meilleur conseiller médical apprend des instructions meilleures

Réponse Aux Questions Intelligente

Yang Tan, Mingchen Li, Zijie Huang, et al.

AlphaEarth Foundations : un modèle de champ d'encodage pour une cartographie mondiale précise et efficace à partir de données étiquetées éparses

IA Pour La Science

Télédétection

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

AetherCode : Évaluation de la capacité des MLN à remporter des compétitions de programmation de premier plan

Génération De Code

Zihan Wang, Jiaze Chen, Zhicheng Liu, et al.

TileLang : Un modèle de programmation par tuiles composables pour les systèmes d'IA

Wang Lei, Cheng Yu, Shi Yining, et al.

DeepSeek-R1 Thoughtology : Réfléchissons au raisonnement des LLM

Sara Vera Marjanović, Arkil Patel, Vaibhav Adlakha, et al.

Intégration multi-ontologie avec propagation à deux axes pour la représentation des concepts médicaux

Génération Augmentée Par La Recherche

Mohsen Nayebi Kerdabadi, Arya Hadizadeh Moghaddam, Dongjie Wang, Zijun Yao

Détection automatisée de problèmes cliniques à partir de notes SOAP à l’aide d’une architecture collaborative à agents multiples basée sur un LLM

Yeawon Lee, Xiaoyang Wang, Christopher C. Yang

SmolDocling : un modèle vision-langage ultra-compact pour la conversion multimodale en bout-en-bout de documents

Compréhension De Document

Ahmed Nassar, Andres Marafioti, Matteo Omenetti, et al.

olmOCR : Déverrouiller des trillions de tokens dans les fichiers PDF à l'aide de modèles vision-langage

Compréhension De Document

Luca Soldaini, Kyle Lo, Christopher Wilhelm, et al.

VA-MoE : Mélange de Experts Adaptatif aux Variables pour la Prévision Climatique Incrementale

IA Pour La Science

Hao Chen, Han Tao, Guo Song, et al.

HuatuoGPT-Vision, vers l'intégration à grande échelle de connaissances visuelles médicales dans les modèles linguistiques multimodaux

Réponse À Des Questions Visuelles

Junying Chen, Ruyi Ouyang, Anningzhe Gao, et al.

Comment la reformulation d'entrée peut-elle améliorer la précision de l'utilisation des outils dans un environnement dynamique complexe ? Une étude sur $τ$-bench

Venkatesh Mishra, Amir Saeidi, Satyam Raj, et al.

Évaluation au niveau de l'interface utilisateur de ALLaM 34B : Mesure d'un LLM centré sur l'arabe à l'aide de HUMAIN Chat

Traitement Du Langage Naturel

Du réactif au cognitif : une intelligence spatiale inspirée du cerveau pour les agents incarnés

Intelligence Incarnée

Shouwei Ruan, Liyuan Wang, Caixin Kang, et al.

Aucune étiquette laissée pour compte : un modèle unifié de détection de défauts de surface pour tous les régimes de supervision

Vision Par Ordinateur

Détection D'objets

Blaž Rolih, Matic Fučka, Danijel Skočaj

T2R-bench : Un benchmark pour la génération de rapports au niveau des articles à partir de tableaux industriels du monde réel

Jie Zhang, Changzai Pan, Kaiwen Wei, et al.

PVPO : Optimisation de politique basée sur la valeur pré-estimée pour le raisonnement agissant

Apprentissage Par Renforcement

Entraînement Du Modèle

Wenfeng Feng, Penghong Zhao, Guochao Jiang, et al.

Entraînement d’un assistant utile et sans danger par apprentissage par renforcement à partir de feedback humain

Modélisation Des Préférences

Apprentissage Par Renforcement

Yuntao Bai, Andy Jones, Kamal Ndousse, et al.

UQ : Évaluation des modèles de langage sur des questions non résolues

Jeu De Données

Fan Nie, Ken Ziyu Liu, Zihao Wang, et al.

CARJAN : Génération et simulation de scénarios de trafic basées sur des agents avec AJAN

Conduite Autonome

Leonard Frank Neis, Andre Antakli, Matthias Klusch

TiKMiX : Intégrer l'influence des données dans un mélange dynamique pour l'entraînement préalable des modèles linguistiques

Entraînement Du Modèle

Yifan Wang, Binbin Liu, Fengze Liu, et al.

Robix : un modèle unifié pour l'interaction, le raisonnement et la planification robotiques

Robix : un modèle unifié pour l'interaction, le raisonnement et la planification robotiques

Intelligence Incarnée

Huang Fang, Mengxi Zhang, Heng Dong, et al.

Test d’intrusion des modèles linguistiques pour réduire les préjudices : méthodes, comportements d’échelle et leçons tirées

Test d’intrusion des modèles linguistiques pour réduire les préjudices : méthodes, comportements d’échelle et leçons tirées

Modélisation Des Préférences

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.

FusionProt : Fusionner les informations séquentielles et structurales pour un apprentissage unifié de la représentation des protéines

Représentation Multimodale

Dan Kalifa, Uriel Singer, Kira Radinsky

LimiX : Libérer le potentiel de modélisation des données structurées pour une intelligence généraliste

Apprentissage Multi-tâches

Xingxuan Zhang, Gang Ren, Han Yu, et al.

epiGPTope : un générateur et classificateur d’épitopes basé sur l’apprentissage automatique

IA Pour La Science

Apprentissage Profond

Natalia Flechas Manrique, Alberto Martínez, Elena López-Martínez, et al.

GenCompositor : composition vidéo générative avec Transformer à diffusion

Génération De Vidéo

Traitement Vidéo

Shuzhou Yang, Xiaoyu Li, Xiaodong Cun, et al.

DCPO : Optimisation dynamique de la politique de découpage

Apprentissage Par Renforcement

Shihui Yang, Chengfeng Dou, Peidong Guo, et al.

Vecteurs de raisonnement : Transfert de capacités de chaîne de raisonnement par arithmétique de tâches

Mohammad Zbeeb, Hasan Abed Al Kader Hammoud, Bernard Ghanem

Baichuan-M2 : Augmenter les capacités médicales grâce à un système de vérification à grande échelle

Baichuan-M2 Team, Chengfeng Dou, Chong Liu, et al.

VerlTool : Vers un apprentissage par renforcement agissant holistique intégrant l'utilisation d'outils

Dongfu Jiang, Yi Lu, Zhuofeng Li, et al.

ELV-Halluc : Évaluation des hallucinations d'agrégation sémantique dans la compréhension des vidéos longues

Hao Lu, Jiahao Wang, Yaolun Zhang, et al.

MedChatZH : un meilleur conseiller médical apprend des instructions meilleures

Réponse Aux Questions Intelligente

Yang Tan, Mingchen Li, Zijie Huang, et al.

AlphaEarth Foundations : un modèle de champ d'encodage pour une cartographie mondiale précise et efficace à partir de données étiquetées éparses

IA Pour La Science

Télédétection

Christopher F. Brown, Michal R. Kazmierski, Valerie J. Pasquarella, et al.

AetherCode : Évaluation de la capacité des MLN à remporter des compétitions de programmation de premier plan

Génération De Code

Zihan Wang, Jiaze Chen, Zhicheng Liu, et al.

TileLang : Un modèle de programmation par tuiles composables pour les systèmes d'IA

Wang Lei, Cheng Yu, Shi Yining, et al.

DeepSeek-R1 Thoughtology : Réfléchissons au raisonnement des LLM

Sara Vera Marjanović, Arkil Patel, Vaibhav Adlakha, et al.

Intégration multi-ontologie avec propagation à deux axes pour la représentation des concepts médicaux

Génération Augmentée Par La Recherche

Mohsen Nayebi Kerdabadi, Arya Hadizadeh Moghaddam, Dongjie Wang, Zijun Yao

Détection automatisée de problèmes cliniques à partir de notes SOAP à l’aide d’une architecture collaborative à agents multiples basée sur un LLM

Yeawon Lee, Xiaoyang Wang, Christopher C. Yang

SmolDocling : un modèle vision-langage ultra-compact pour la conversion multimodale en bout-en-bout de documents

Compréhension De Document

Ahmed Nassar, Andres Marafioti, Matteo Omenetti, et al.

olmOCR : Déverrouiller des trillions de tokens dans les fichiers PDF à l'aide de modèles vision-langage

Compréhension De Document

Luca Soldaini, Kyle Lo, Christopher Wilhelm, et al.

VA-MoE : Mélange de Experts Adaptatif aux Variables pour la Prévision Climatique Incrementale

IA Pour La Science

Hao Chen, Han Tao, Guo Song, et al.

HuatuoGPT-Vision, vers l'intégration à grande échelle de connaissances visuelles médicales dans les modèles linguistiques multimodaux

Réponse À Des Questions Visuelles

Junying Chen, Ruyi Ouyang, Anningzhe Gao, et al.

Comment la reformulation d'entrée peut-elle améliorer la précision de l'utilisation des outils dans un environnement dynamique complexe ? Une étude sur $τ$-bench

Venkatesh Mishra, Amir Saeidi, Satyam Raj, et al.

Évaluation au niveau de l'interface utilisateur de ALLaM 34B : Mesure d'un LLM centré sur l'arabe à l'aide de HUMAIN Chat

Traitement Du Langage Naturel

Du réactif au cognitif : une intelligence spatiale inspirée du cerveau pour les agents incarnés

Intelligence Incarnée

Shouwei Ruan, Liyuan Wang, Caixin Kang, et al.

Aucune étiquette laissée pour compte : un modèle unifié de détection de défauts de surface pour tous les régimes de supervision

Vision Par Ordinateur

Détection D'objets

Blaž Rolih, Matic Fučka, Danijel Skočaj

T2R-bench : Un benchmark pour la génération de rapports au niveau des articles à partir de tableaux industriels du monde réel

Jie Zhang, Changzai Pan, Kaiwen Wei, et al.

PVPO : Optimisation de politique basée sur la valeur pré-estimée pour le raisonnement agissant

Apprentissage Par Renforcement

Entraînement Du Modèle

Wenfeng Feng, Penghong Zhao, Guochao Jiang, et al.

Entraînement d’un assistant utile et sans danger par apprentissage par renforcement à partir de feedback humain

Modélisation Des Préférences

Apprentissage Par Renforcement

Yuntao Bai, Andy Jones, Kamal Ndousse, et al.

UQ : Évaluation des modèles de langage sur des questions non résolues

Jeu De Données

Fan Nie, Ken Ziyu Liu, Zihao Wang, et al.

CARJAN : Génération et simulation de scénarios de trafic basées sur des agents avec AJAN

Conduite Autonome

Leonard Frank Neis, Andre Antakli, Matthias Klusch

TiKMiX : Intégrer l'influence des données dans un mélange dynamique pour l'entraînement préalable des modèles linguistiques

Entraînement Du Modèle

Yifan Wang, Binbin Liu, Fengze Liu, et al.

FusionProt : Fusionner les informations séquentielles et structurales pour un apprentissage unifié de la représentation des protéines

LimiX : Libérer le potentiel de modélisation des données structurées pour une intelligence généraliste

epiGPTope : un générateur et classificateur d’épitopes basé sur l’apprentissage automatique

GenCompositor : composition vidéo générative avec Transformer à diffusion

DCPO : Optimisation dynamique de la politique de découpage

Vecteurs de raisonnement : Transfert de capacités de chaîne de raisonnement par arithmétique de tâches

Baichuan-M2 : Augmenter les capacités médicales grâce à un système de vérification à grande échelle

VerlTool : Vers un apprentissage par renforcement agissant holistique intégrant l'utilisation d'outils

ELV-Halluc : Évaluation des hallucinations d'agrégation sémantique dans la compréhension des vidéos longues

MedChatZH : un meilleur conseiller médical apprend des instructions meilleures

AlphaEarth Foundations : un modèle de champ d'encodage pour une cartographie mondiale précise et efficace à partir de données étiquetées éparses

AetherCode : Évaluation de la capacité des MLN à remporter des compétitions de programmation de premier plan

TileLang : Un modèle de programmation par tuiles composables pour les systèmes d'IA

DeepSeek-R1 Thoughtology : Réfléchissons au raisonnement des LLM

Intégration multi-ontologie avec propagation à deux axes pour la représentation des concepts médicaux

Détection automatisée de problèmes cliniques à partir de notes SOAP à l’aide d’une architecture collaborative à agents multiples basée sur un LLM

SmolDocling : un modèle vision-langage ultra-compact pour la conversion multimodale en bout-en-bout de documents

olmOCR : Déverrouiller des trillions de tokens dans les fichiers PDF à l'aide de modèles vision-langage

VA-MoE : Mélange de Experts Adaptatif aux Variables pour la Prévision Climatique Incrementale

HuatuoGPT-Vision, vers l'intégration à grande échelle de connaissances visuelles médicales dans les modèles linguistiques multimodaux

Comment la reformulation d'entrée peut-elle améliorer la précision de l'utilisation des outils dans un environnement dynamique complexe ? Une étude sur $τ$ -bench

Évaluation au niveau de l'interface utilisateur de ALLaM 34B : Mesure d'un LLM centré sur l'arabe à l'aide de HUMAIN Chat

Du réactif au cognitif : une intelligence spatiale inspirée du cerveau pour les agents incarnés

Aucune étiquette laissée pour compte : un modèle unifié de détection de défauts de surface pour tous les régimes de supervision

T2R-bench : Un benchmark pour la génération de rapports au niveau des articles à partir de tableaux industriels du monde réel

PVPO : Optimisation de politique basée sur la valeur pré-estimée pour le raisonnement agissant

Entraînement d’un assistant utile et sans danger par apprentissage par renforcement à partir de feedback humain

UQ : Évaluation des modèles de langage sur des questions non résolues

CARJAN : Génération et simulation de scénarios de trafic basées sur des agents avec AJAN

TiKMiX : Intégrer l'influence des données dans un mélange dynamique pour l'entraînement préalable des modèles linguistiques

FusionProt : Fusionner les informations séquentielles et structurales pour un apprentissage unifié de la représentation des protéines

LimiX : Libérer le potentiel de modélisation des données structurées pour une intelligence généraliste

epiGPTope : un générateur et classificateur d’épitopes basé sur l’apprentissage automatique

GenCompositor : composition vidéo générative avec Transformer à diffusion

DCPO : Optimisation dynamique de la politique de découpage

Vecteurs de raisonnement : Transfert de capacités de chaîne de raisonnement par arithmétique de tâches

Baichuan-M2 : Augmenter les capacités médicales grâce à un système de vérification à grande échelle

VerlTool : Vers un apprentissage par renforcement agissant holistique intégrant l'utilisation d'outils

ELV-Halluc : Évaluation des hallucinations d'agrégation sémantique dans la compréhension des vidéos longues

MedChatZH : un meilleur conseiller médical apprend des instructions meilleures

AlphaEarth Foundations : un modèle de champ d'encodage pour une cartographie mondiale précise et efficace à partir de données étiquetées éparses

AetherCode : Évaluation de la capacité des MLN à remporter des compétitions de programmation de premier plan

TileLang : Un modèle de programmation par tuiles composables pour les systèmes d'IA

DeepSeek-R1 Thoughtology : Réfléchissons au raisonnement des LLM

Intégration multi-ontologie avec propagation à deux axes pour la représentation des concepts médicaux

Détection automatisée de problèmes cliniques à partir de notes SOAP à l’aide d’une architecture collaborative à agents multiples basée sur un LLM

SmolDocling : un modèle vision-langage ultra-compact pour la conversion multimodale en bout-en-bout de documents

olmOCR : Déverrouiller des trillions de tokens dans les fichiers PDF à l'aide de modèles vision-langage

VA-MoE : Mélange de Experts Adaptatif aux Variables pour la Prévision Climatique Incrementale

HuatuoGPT-Vision, vers l'intégration à grande échelle de connaissances visuelles médicales dans les modèles linguistiques multimodaux

Comment la reformulation d'entrée peut-elle améliorer la précision de l'utilisation des outils dans un environnement dynamique complexe ? Une étude sur $τ$ -bench

Évaluation au niveau de l'interface utilisateur de ALLaM 34B : Mesure d'un LLM centré sur l'arabe à l'aide de HUMAIN Chat

Du réactif au cognitif : une intelligence spatiale inspirée du cerveau pour les agents incarnés

Aucune étiquette laissée pour compte : un modèle unifié de détection de défauts de surface pour tous les régimes de supervision

T2R-bench : Un benchmark pour la génération de rapports au niveau des articles à partir de tableaux industriels du monde réel

PVPO : Optimisation de politique basée sur la valeur pré-estimée pour le raisonnement agissant

Entraînement d’un assistant utile et sans danger par apprentissage par renforcement à partir de feedback humain

UQ : Évaluation des modèles de langage sur des questions non résolues

CARJAN : Génération et simulation de scénarios de trafic basées sur des agents avec AJAN

TiKMiX : Intégrer l'influence des données dans un mélange dynamique pour l'entraînement préalable des modèles linguistiques