HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

OSC : Orchestration cognitive par alignement dynamique des connaissances dans la collaboration multi-agents basée sur les grands modèles linguistiques

OSC : Orchestration cognitive par alignement dynamique des connaissances dans la collaboration multi-agents basée sur les grands modèles linguistiques

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

CURE : Désapprentissage contrôlé pour des embeddings robustes – Atténuation des raccourcis conceptuels dans les modèles linguistiques pré-entraînés

CURE : Désapprentissage contrôlé pour des embeddings robustes – Atténuation des raccourcis conceptuels dans les modèles linguistiques pré-entraînés

Traitement Du Langage Naturel

Affinage Supervisé

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

MedVista3D : Modélisation vision-langage pour la réduction des erreurs diagnostiques dans la détection, la compréhension et la rédaction des rapports des maladies à partir de scanners 3D

Réponse À Des Questions Visuelles

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

LuxDiT : Estimation d'éclairage avec un transformateur à diffusion vidéo

Modèle De Diffusion

Ruofan Liang, Kai He, Zan Gojcic, et al.

WildScore : Évaluation des MLLM en raisonnement musical symbolique dans des conditions réelles

Réponse À Des Questions Visuelles

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

Set Block Decoding est un accélérateur d'inférence pour les modèles de langage

Génération De Texte

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

Programmation graphique symbolique avec des grands modèles linguistiques

Génération De Code

Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.

Pourquoi les modèles linguistiques font-ils des hallucinations

Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.

LatticeWorld : Un cadre alimenté par un grand modèle linguistique multimodal pour la génération interactive de mondes complexes

Génération 3D

Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.

Recomposer : édition audio générique guidée par le roll d'événements

Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.

Modèles de transition : Repenser l'objectif d'apprentissage génératif

Modèle De Diffusion

Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.

Inverse IFEval : Les LLM peuvent-ils désapprendre des conventions d'entraînement tenaces afin de suivre des instructions réelles ?

Affinage Supervisé

Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.

DeepResearch Arena : Le premier examen des capacités de recherche des modèles linguistiques à grande échelle au travers de tâches fondées sur des séminaires

Haiyuan Wan, Chen Yang, Junchi Yu, et al.

Vers une vision unifiée de l'après-formation des grands modèles linguistiques

Affinage Supervisé

Apprentissage Par Renforcement

Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.

Du rédacteur à l'estimateur de géométrie dense

Estimation De Profondeur

Modèle De Diffusion

JiYuan Wang, Chunyu Lin, Lei Sun, et al.

Drivel-ologie : Mettre les LLM au défi en interprétant le non-sens avec profondeur

Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.

Loong : Synthétiser à grande échelle des chaînes de raisonnement longues grâce à des vérificateurs

Jeu De Données

Xingyue Huang, Rishabh, Gregor Franke, et al.

ArcMemo : Composition raisonnement abstrait avec une mémoire de modèle linguistique évolutif

Matthew Ho, Chen Si, Zhaoxiang Feng, et al.

CoT-Space : un cadre théorique pour la pensée lente interne par apprentissage par renforcement

Apprentissage Par Renforcement

Zeyu Gan, Hao Yi, Yong Liu

Suivi de points 3D à vue multiple

Vision Machine 3D

Estimation De Profondeur

Frano Rajič, Haofei Xu, Marko Mihajlovic, et al.

Résultats de la compétition Landslide4Sense 2022 : détection avancée des glissements de terrain à partir d’images satellitaires multi-sources

Vision Par Ordinateur

Télédétection

Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.

MOSAIC : Génération personnalisée multi-sujets par alignement et désenchevêtrement conscient de la correspondance

Génération D'images

Dong She, Siming Fu, Mushui Liu, et al.

Mélange d'experts globaux et locaux avec un transformateur à diffusion pour une génération contrôlable de visages

Modèle De Diffusion

Génération D'images

Xuechao Zou, Shun Zhang, Xing Fu, et al.

Sur les limites théoriques de la recherche basée sur les embeddings

Génération Augmentée Par La Recherche

Orion Weller, Michael Boratko, Iftekhar Naim, et al.

LMEnt : Un ensemble pour analyser les connaissances dans les modèles linguistiques, de la donnée d'entraînement préalable aux représentations

Jeu De Données

Daniela Gottesman, Alon Gilae-Dotan, Ido Cohen, et al.

Synthèse des données ouvertes pour une recherche approfondie

Ziyi Xia, Kun Luo, Hongjin Qian, et al.

Robix : un modèle unifié pour l'interaction, le raisonnement et la planification robotiques

Intelligence Incarnée

Huang Fang, Mengxi Zhang, Heng Dong, et al.

Test d’intrusion des modèles linguistiques pour réduire les préjudices : méthodes, comportements d’échelle et leçons tirées

Modélisation Des Préférences

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.

FusionProt : Fusionner les informations séquentielles et structurales pour un apprentissage unifié de la représentation des protéines

Représentation Multimodale

Dan Kalifa, Uriel Singer, Kira Radinsky

LimiX : Libérer le potentiel de modélisation des données structurées pour une intelligence généraliste

Apprentissage Multi-tâches

Xingxuan Zhang, Gang Ren, Han Yu, et al.

epiGPTope : un générateur et classificateur d’épitopes basé sur l’apprentissage automatique

IA Pour La Science

Apprentissage Profond

Natalia Flechas Manrique, Alberto Martínez, Elena López-Martínez, et al.

GenCompositor : composition vidéo générative avec Transformer à diffusion

Génération De Vidéo

Traitement Vidéo

Shuzhou Yang, Xiaoyu Li, Xiaodong Cun, et al.

OSC : Orchestration cognitive par alignement dynamique des connaissances dans la collaboration multi-agents basée sur les grands modèles linguistiques

OSC : Orchestration cognitive par alignement dynamique des connaissances dans la collaboration multi-agents basée sur les grands modèles linguistiques

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

CURE : Désapprentissage contrôlé pour des embeddings robustes – Atténuation des raccourcis conceptuels dans les modèles linguistiques pré-entraînés

CURE : Désapprentissage contrôlé pour des embeddings robustes – Atténuation des raccourcis conceptuels dans les modèles linguistiques pré-entraînés

Traitement Du Langage Naturel

Affinage Supervisé

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

MedVista3D : Modélisation vision-langage pour la réduction des erreurs diagnostiques dans la détection, la compréhension et la rédaction des rapports des maladies à partir de scanners 3D

Réponse À Des Questions Visuelles

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

LuxDiT : Estimation d'éclairage avec un transformateur à diffusion vidéo

Modèle De Diffusion

Ruofan Liang, Kai He, Zan Gojcic, et al.

WildScore : Évaluation des MLLM en raisonnement musical symbolique dans des conditions réelles

Réponse À Des Questions Visuelles

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

Set Block Decoding est un accélérateur d'inférence pour les modèles de langage

Génération De Texte

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

Programmation graphique symbolique avec des grands modèles linguistiques

Génération De Code

Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.

Pourquoi les modèles linguistiques font-ils des hallucinations

Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.

LatticeWorld : Un cadre alimenté par un grand modèle linguistique multimodal pour la génération interactive de mondes complexes

Génération 3D

Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.

Recomposer : édition audio générique guidée par le roll d'événements

Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.

Modèles de transition : Repenser l'objectif d'apprentissage génératif

Modèle De Diffusion

Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.

Inverse IFEval : Les LLM peuvent-ils désapprendre des conventions d'entraînement tenaces afin de suivre des instructions réelles ?

Affinage Supervisé

Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.

DeepResearch Arena : Le premier examen des capacités de recherche des modèles linguistiques à grande échelle au travers de tâches fondées sur des séminaires

Haiyuan Wan, Chen Yang, Junchi Yu, et al.

Vers une vision unifiée de l'après-formation des grands modèles linguistiques

Affinage Supervisé

Apprentissage Par Renforcement

Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.

Du rédacteur à l'estimateur de géométrie dense

Estimation De Profondeur

Modèle De Diffusion

JiYuan Wang, Chunyu Lin, Lei Sun, et al.

Drivel-ologie : Mettre les LLM au défi en interprétant le non-sens avec profondeur

Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.

Loong : Synthétiser à grande échelle des chaînes de raisonnement longues grâce à des vérificateurs

Jeu De Données

Xingyue Huang, Rishabh, Gregor Franke, et al.

ArcMemo : Composition raisonnement abstrait avec une mémoire de modèle linguistique évolutif

Matthew Ho, Chen Si, Zhaoxiang Feng, et al.

CoT-Space : un cadre théorique pour la pensée lente interne par apprentissage par renforcement

Apprentissage Par Renforcement

Zeyu Gan, Hao Yi, Yong Liu

Suivi de points 3D à vue multiple

Vision Machine 3D

Estimation De Profondeur

Frano Rajič, Haofei Xu, Marko Mihajlovic, et al.

Résultats de la compétition Landslide4Sense 2022 : détection avancée des glissements de terrain à partir d’images satellitaires multi-sources

Vision Par Ordinateur

Télédétection

Omid Ghorbanzadeh, Yonghao Xu, Hengwei Zhao, et al.

MOSAIC : Génération personnalisée multi-sujets par alignement et désenchevêtrement conscient de la correspondance

Génération D'images

Dong She, Siming Fu, Mushui Liu, et al.

Mélange d'experts globaux et locaux avec un transformateur à diffusion pour une génération contrôlable de visages

Modèle De Diffusion

Génération D'images

Xuechao Zou, Shun Zhang, Xing Fu, et al.

Sur les limites théoriques de la recherche basée sur les embeddings

Génération Augmentée Par La Recherche

Orion Weller, Michael Boratko, Iftekhar Naim, et al.

LMEnt : Un ensemble pour analyser les connaissances dans les modèles linguistiques, de la donnée d'entraînement préalable aux représentations

Jeu De Données

Daniela Gottesman, Alon Gilae-Dotan, Ido Cohen, et al.

Synthèse des données ouvertes pour une recherche approfondie

Ziyi Xia, Kun Luo, Hongjin Qian, et al.

Robix : un modèle unifié pour l'interaction, le raisonnement et la planification robotiques

Intelligence Incarnée

Huang Fang, Mengxi Zhang, Heng Dong, et al.

Test d’intrusion des modèles linguistiques pour réduire les préjudices : méthodes, comportements d’échelle et leçons tirées

Modélisation Des Préférences

Deep Ganguli, Liane Lovitt, Jackson Kernion, et al.

FusionProt : Fusionner les informations séquentielles et structurales pour un apprentissage unifié de la représentation des protéines

Représentation Multimodale

Dan Kalifa, Uriel Singer, Kira Radinsky

LimiX : Libérer le potentiel de modélisation des données structurées pour une intelligence généraliste

Apprentissage Multi-tâches

Xingxuan Zhang, Gang Ren, Han Yu, et al.

epiGPTope : un générateur et classificateur d’épitopes basé sur l’apprentissage automatique

IA Pour La Science

Apprentissage Profond

Natalia Flechas Manrique, Alberto Martínez, Elena López-Martínez, et al.

GenCompositor : composition vidéo générative avec Transformer à diffusion

Génération De Vidéo

Traitement Vidéo

Shuzhou Yang, Xiaoyu Li, Xiaodong Cun, et al.

MedVista3D : Modélisation vision-langage pour la réduction des erreurs diagnostiques dans la détection, la compréhension et la rédaction des rapports des maladies à partir de scanners 3D

LuxDiT : Estimation d'éclairage avec un transformateur à diffusion vidéo

WildScore : Évaluation des MLLM en raisonnement musical symbolique dans des conditions réelles

Set Block Decoding est un accélérateur d'inférence pour les modèles de langage

Programmation graphique symbolique avec des grands modèles linguistiques

Pourquoi les modèles linguistiques font-ils des hallucinations

LatticeWorld : Un cadre alimenté par un grand modèle linguistique multimodal pour la génération interactive de mondes complexes

Recomposer : édition audio générique guidée par le roll d'événements

Modèles de transition : Repenser l'objectif d'apprentissage génératif

Inverse IFEval : Les LLM peuvent-ils désapprendre des conventions d'entraînement tenaces afin de suivre des instructions réelles ?

DeepResearch Arena : Le premier examen des capacités de recherche des modèles linguistiques à grande échelle au travers de tâches fondées sur des séminaires

Vers une vision unifiée de l'après-formation des grands modèles linguistiques

Du rédacteur à l'estimateur de géométrie dense

Drivel-ologie : Mettre les LLM au défi en interprétant le non-sens avec profondeur

Loong : Synthétiser à grande échelle des chaînes de raisonnement longues grâce à des vérificateurs

ArcMemo : Composition raisonnement abstrait avec une mémoire de modèle linguistique évolutif

CoT-Space : un cadre théorique pour la pensée lente interne par apprentissage par renforcement

Suivi de points 3D à vue multiple

Résultats de la compétition Landslide4Sense 2022 : détection avancée des glissements de terrain à partir d’images satellitaires multi-sources

MOSAIC : Génération personnalisée multi-sujets par alignement et désenchevêtrement conscient de la correspondance

Mélange d'experts globaux et locaux avec un transformateur à diffusion pour une génération contrôlable de visages

Sur les limites théoriques de la recherche basée sur les embeddings

LMEnt : Un ensemble pour analyser les connaissances dans les modèles linguistiques, de la donnée d'entraînement préalable aux représentations

Synthèse des données ouvertes pour une recherche approfondie

Robix : un modèle unifié pour l'interaction, le raisonnement et la planification robotiques

Test d’intrusion des modèles linguistiques pour réduire les préjudices : méthodes, comportements d’échelle et leçons tirées

FusionProt : Fusionner les informations séquentielles et structurales pour un apprentissage unifié de la représentation des protéines

LimiX : Libérer le potentiel de modélisation des données structurées pour une intelligence généraliste

epiGPTope : un générateur et classificateur d’épitopes basé sur l’apprentissage automatique

GenCompositor : composition vidéo générative avec Transformer à diffusion

MedVista3D : Modélisation vision-langage pour la réduction des erreurs diagnostiques dans la détection, la compréhension et la rédaction des rapports des maladies à partir de scanners 3D

LuxDiT : Estimation d'éclairage avec un transformateur à diffusion vidéo

WildScore : Évaluation des MLLM en raisonnement musical symbolique dans des conditions réelles

Set Block Decoding est un accélérateur d'inférence pour les modèles de langage

Programmation graphique symbolique avec des grands modèles linguistiques

Pourquoi les modèles linguistiques font-ils des hallucinations

LatticeWorld : Un cadre alimenté par un grand modèle linguistique multimodal pour la génération interactive de mondes complexes

Recomposer : édition audio générique guidée par le roll d'événements

Modèles de transition : Repenser l'objectif d'apprentissage génératif

Inverse IFEval : Les LLM peuvent-ils désapprendre des conventions d'entraînement tenaces afin de suivre des instructions réelles ?

DeepResearch Arena : Le premier examen des capacités de recherche des modèles linguistiques à grande échelle au travers de tâches fondées sur des séminaires

Vers une vision unifiée de l'après-formation des grands modèles linguistiques

Du rédacteur à l'estimateur de géométrie dense

Drivel-ologie : Mettre les LLM au défi en interprétant le non-sens avec profondeur

Loong : Synthétiser à grande échelle des chaînes de raisonnement longues grâce à des vérificateurs

ArcMemo : Composition raisonnement abstrait avec une mémoire de modèle linguistique évolutif

CoT-Space : un cadre théorique pour la pensée lente interne par apprentissage par renforcement

Suivi de points 3D à vue multiple

Résultats de la compétition Landslide4Sense 2022 : détection avancée des glissements de terrain à partir d’images satellitaires multi-sources

MOSAIC : Génération personnalisée multi-sujets par alignement et désenchevêtrement conscient de la correspondance

Mélange d'experts globaux et locaux avec un transformateur à diffusion pour une génération contrôlable de visages

Sur les limites théoriques de la recherche basée sur les embeddings

LMEnt : Un ensemble pour analyser les connaissances dans les modèles linguistiques, de la donnée d'entraînement préalable aux représentations

Synthèse des données ouvertes pour une recherche approfondie

Robix : un modèle unifié pour l'interaction, le raisonnement et la planification robotiques

Test d’intrusion des modèles linguistiques pour réduire les préjudices : méthodes, comportements d’échelle et leçons tirées

FusionProt : Fusionner les informations séquentielles et structurales pour un apprentissage unifié de la représentation des protéines

LimiX : Libérer le potentiel de modélisation des données structurées pour une intelligence généraliste

epiGPTope : un générateur et classificateur d’épitopes basé sur l’apprentissage automatique

GenCompositor : composition vidéo générative avec Transformer à diffusion