HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Communication sémantique directe entre modèles de langage massifs par échange de cache

Communication sémantique directe entre modèles de langage massifs par échange de cache

Tianyu Fu, Zihan Min, Hanling Zhang, et al.

Ming-UniVision : Compréhension et génération d'images conjointes à l'aide d'un tokeniseur continu unifié

Ming-UniVision : Compréhension et génération d'images conjointes à l'aide d'un tokeniseur continu unifié

Compréhension D'images

Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.

Rapport technique Phi-3 : un modèle linguistique hautement performant fonctionnant localement sur votre téléphone

Entraînement Du Modèle

Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.

Rapport technique Qwen2.5

Affinage Supervisé

Qwen, An Yang, Baosong Yang, et al.

Découverte d'algorithmes scientifiques par l'augmentation d'AlphaEvolve avec une recherche approfondie

Gang Liu, Yihan Zhu, Jie Chen, et al.

ConstraintLLM : un cadre neuro-symbolique pour la programmation par contraintes à l'échelle industrielle

Affinage Supervisé

Weichun Shi, Minghao Liu, Wanting Zhang, et al.

Scaling des chaînes de raisonnement assistées par le code et des instructions pour le raisonnement des modèles

Génération De Code

Honglin Lin, Qizhi Pei, Xin Gao, et al.

CoDA : Codage des ML par adaptation par diffusion

Modèle De Diffusion

Génération De Texte

Haolin Chen, Shiyu Wang, Can Qin, et al.

Fast-dLLM v2 : Modèle LLM à diffusion par blocs efficace

Modèle De Diffusion

Entraînement Du Modèle

Chengyue Wu, Hao Zhang, Shuchen Xue, et al.

Moins, c'est mieux : un raisonnement récursif avec des réseaux réduits

Réseaux De Neurones

Alexia Jolicoeur-Martineau

Fathom-DeepResearch : Déverrouiller la recherche d'information et la synthèse à long terme pour les SLM

Réponse Aux Questions Intelligente

Shreyas Singh, Kunal Singh, Pradeep Moturi

TaTToo : PRM fondé sur un outil pour le raisonnement à temps de test dans le raisonnement tabulaire

Affinage Supervisé

Jiaru Zou, Soumya Roy, Vinay Kumar Verma, et al.

Architectures hybrides pour les modèles linguistiques : analyse systématique et insights sur la conception

Sangmin Bae, Bilge Acun, Haroun Habeeb, et al.

MITS : Amélioration du raisonnement par recherche arborescente pour les LSM grâce à l'information mutuelle ponctuelle

Jiaxi Li, Yucheng Shi, Jin Lu, et al.

Évasion imperceptible des grands modèles linguistiques

Génération De Texte

Kuofeng Gao, Yiming Li, Chao Du, et al.

VChain : Chaîne de raisonnement visuel pour le raisonnement dans la génération vidéo

Génération De Vidéo

Ziqi Huang, Ning Yu, Gordon Chen, et al.

Post-entraînement des modèles multimodaux grands pour vidéos : une analyse approfondie du raisonnement vidéo à l’aide de modèles multimodaux grands

Affinage Supervisé

Yunlong Tang, Jing Bi, Pinxin Liu, et al.

Paper2Video : génération automatique de vidéos à partir d'articles scientifiques

Texte Vers Vidéo

Zeyu Zhu, Kevin Qinghong Lin, Mike Zheng Shou

Ponctuer l'écart entre l'engagement et les performances pour la quantification FP4 en microéchelle

Vage Egiazarian, Roberto L. Castro, Denis Kuznedelev, et al.

Amélioration autonome des grands modèles linguistiques multimodaux : une revue

Shijian Deng, Kai Wang, Tianyu Yang, et al.

Composez vos politiques ! Amélioration des politiques robotiques basées sur la diffusion ou sur les flux par composition au niveau de la distribution à l'heure du test

Modèle De Diffusion

Jiahang Cao, Yize Huang, Hanzhong Guo, et al.

Les grands modèles de raisonnement apprennent une meilleure alignement à partir d'une pensée défectueuse

Modélisation Des Préférences

ShengYun Peng, Eric Smith, Ivan Evtimov, et al.

Modèles linguistiques massifs multi-modaux efficaces par distillation progressive de cohérence

Zichen Wen, Shaobo Wang, Yufa Zhou, et al.

Apriel-1.5-15b-Thinker

Réponse À Des Questions Visuelles

Shruthan Radhakrishna, Aman Tiwari, Aanjaneya Shukla, et al.

StockBench : Les agents basés sur les modèles linguistiques peuvent-ils trader des actions avec profit sur les marchés réels ?

Yanxu Chen, Zijun Yao, Yantao Liu, et al.

Formation interactive : optimisation des réseaux de neurones pilotée par les retours

Entraînement Du Modèle

Interaction Homme-Machine

Wentao Zhang, Yang Young Lu, Yuntian Deng

StealthAttack : Empoisonnement par projection de nuages de points 3D robuste basé sur des illusions guidées par la densité

Génération 3D

Vision Machine 3D

Bo-Hsu Ke, You-Zhe Xie, Yu-Lun Liu, et al.

ExGRPO : Apprendre à raisonner à partir de l'expérience

Apprentissage Par Renforcement

Runzhe Zhan, Yafu Li, Zhi Wang, et al.

Self-Forcing++ : Vers une génération vidéo de haute qualité à l'échelle de la minute

Modèle De Diffusion

Génération De Vidéo

Justin Cui, Jie Wu, Ming Li, et al.

LongCodeZip : Compression du contexte long pour les modèles linguistiques de code

Génération De Code

Yuling Shi, Yichun Qian, Hongyu Zhang, et al.

PIPer : Configuration d'environnement sur dispositif par apprentissage par renforcement en ligne

Apprentissage Par Renforcement

Affinage Supervisé

Alexander Kovrigin, Aleksandra Eliseeva, Konstantin Grotov, et al.

Repenser les modèles de récompense pour le scaling à temps de test multi-domaines

Affinage Supervisé

Dong Bok Lee, Seanie Lee, Sangwoo Park, et al.

Communication sémantique directe entre modèles de langage massifs par échange de cache

Communication sémantique directe entre modèles de langage massifs par échange de cache

Tianyu Fu, Zihan Min, Hanling Zhang, et al.

Ming-UniVision : Compréhension et génération d'images conjointes à l'aide d'un tokeniseur continu unifié

Ming-UniVision : Compréhension et génération d'images conjointes à l'aide d'un tokeniseur continu unifié

Compréhension D'images

Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.

Rapport technique Phi-3 : un modèle linguistique hautement performant fonctionnant localement sur votre téléphone

Entraînement Du Modèle

Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.

Rapport technique Qwen2.5

Affinage Supervisé

Qwen, An Yang, Baosong Yang, et al.

Découverte d'algorithmes scientifiques par l'augmentation d'AlphaEvolve avec une recherche approfondie

Gang Liu, Yihan Zhu, Jie Chen, et al.

ConstraintLLM : un cadre neuro-symbolique pour la programmation par contraintes à l'échelle industrielle

Affinage Supervisé

Weichun Shi, Minghao Liu, Wanting Zhang, et al.

Scaling des chaînes de raisonnement assistées par le code et des instructions pour le raisonnement des modèles

Génération De Code

Honglin Lin, Qizhi Pei, Xin Gao, et al.

CoDA : Codage des ML par adaptation par diffusion

Modèle De Diffusion

Génération De Texte

Haolin Chen, Shiyu Wang, Can Qin, et al.

Fast-dLLM v2 : Modèle LLM à diffusion par blocs efficace

Modèle De Diffusion

Entraînement Du Modèle

Chengyue Wu, Hao Zhang, Shuchen Xue, et al.

Moins, c'est mieux : un raisonnement récursif avec des réseaux réduits

Réseaux De Neurones

Alexia Jolicoeur-Martineau

Fathom-DeepResearch : Déverrouiller la recherche d'information et la synthèse à long terme pour les SLM

Réponse Aux Questions Intelligente

Shreyas Singh, Kunal Singh, Pradeep Moturi

TaTToo : PRM fondé sur un outil pour le raisonnement à temps de test dans le raisonnement tabulaire

Affinage Supervisé

Jiaru Zou, Soumya Roy, Vinay Kumar Verma, et al.

Architectures hybrides pour les modèles linguistiques : analyse systématique et insights sur la conception

Sangmin Bae, Bilge Acun, Haroun Habeeb, et al.

MITS : Amélioration du raisonnement par recherche arborescente pour les LSM grâce à l'information mutuelle ponctuelle

Jiaxi Li, Yucheng Shi, Jin Lu, et al.

Évasion imperceptible des grands modèles linguistiques

Génération De Texte

Kuofeng Gao, Yiming Li, Chao Du, et al.

VChain : Chaîne de raisonnement visuel pour le raisonnement dans la génération vidéo

Génération De Vidéo

Ziqi Huang, Ning Yu, Gordon Chen, et al.

Post-entraînement des modèles multimodaux grands pour vidéos : une analyse approfondie du raisonnement vidéo à l’aide de modèles multimodaux grands

Affinage Supervisé

Yunlong Tang, Jing Bi, Pinxin Liu, et al.

Paper2Video : génération automatique de vidéos à partir d'articles scientifiques

Texte Vers Vidéo

Zeyu Zhu, Kevin Qinghong Lin, Mike Zheng Shou

Ponctuer l'écart entre l'engagement et les performances pour la quantification FP4 en microéchelle

Vage Egiazarian, Roberto L. Castro, Denis Kuznedelev, et al.

Amélioration autonome des grands modèles linguistiques multimodaux : une revue

Shijian Deng, Kai Wang, Tianyu Yang, et al.

Composez vos politiques ! Amélioration des politiques robotiques basées sur la diffusion ou sur les flux par composition au niveau de la distribution à l'heure du test

Modèle De Diffusion

Jiahang Cao, Yize Huang, Hanzhong Guo, et al.

Les grands modèles de raisonnement apprennent une meilleure alignement à partir d'une pensée défectueuse

Modélisation Des Préférences

ShengYun Peng, Eric Smith, Ivan Evtimov, et al.

Modèles linguistiques massifs multi-modaux efficaces par distillation progressive de cohérence

Zichen Wen, Shaobo Wang, Yufa Zhou, et al.

Apriel-1.5-15b-Thinker

Réponse À Des Questions Visuelles

Shruthan Radhakrishna, Aman Tiwari, Aanjaneya Shukla, et al.

StockBench : Les agents basés sur les modèles linguistiques peuvent-ils trader des actions avec profit sur les marchés réels ?

Yanxu Chen, Zijun Yao, Yantao Liu, et al.

Formation interactive : optimisation des réseaux de neurones pilotée par les retours

Entraînement Du Modèle

Interaction Homme-Machine

Wentao Zhang, Yang Young Lu, Yuntian Deng

StealthAttack : Empoisonnement par projection de nuages de points 3D robuste basé sur des illusions guidées par la densité

Génération 3D

Vision Machine 3D

Bo-Hsu Ke, You-Zhe Xie, Yu-Lun Liu, et al.

ExGRPO : Apprendre à raisonner à partir de l'expérience

Apprentissage Par Renforcement

Runzhe Zhan, Yafu Li, Zhi Wang, et al.

Self-Forcing++ : Vers une génération vidéo de haute qualité à l'échelle de la minute

Modèle De Diffusion

Génération De Vidéo

Justin Cui, Jie Wu, Ming Li, et al.

LongCodeZip : Compression du contexte long pour les modèles linguistiques de code

Génération De Code

Yuling Shi, Yichun Qian, Hongyu Zhang, et al.

PIPer : Configuration d'environnement sur dispositif par apprentissage par renforcement en ligne

Apprentissage Par Renforcement

Affinage Supervisé

Alexander Kovrigin, Aleksandra Eliseeva, Konstantin Grotov, et al.

Repenser les modèles de récompense pour le scaling à temps de test multi-domaines

Affinage Supervisé

Dong Bok Lee, Seanie Lee, Sangwoo Park, et al.

Rapport technique Phi-3 : un modèle linguistique hautement performant fonctionnant localement sur votre téléphone

Rapport technique Qwen2.5

Découverte d'algorithmes scientifiques par l'augmentation d'AlphaEvolve avec une recherche approfondie

ConstraintLLM : un cadre neuro-symbolique pour la programmation par contraintes à l'échelle industrielle

Scaling des chaînes de raisonnement assistées par le code et des instructions pour le raisonnement des modèles

CoDA : Codage des ML par adaptation par diffusion

Fast-dLLM v2 : Modèle LLM à diffusion par blocs efficace

Moins, c'est mieux : un raisonnement récursif avec des réseaux réduits

Fathom-DeepResearch : Déverrouiller la recherche d'information et la synthèse à long terme pour les SLM

TaTToo : PRM fondé sur un outil pour le raisonnement à temps de test dans le raisonnement tabulaire

Architectures hybrides pour les modèles linguistiques : analyse systématique et insights sur la conception

MITS : Amélioration du raisonnement par recherche arborescente pour les LSM grâce à l'information mutuelle ponctuelle

Évasion imperceptible des grands modèles linguistiques

VChain : Chaîne de raisonnement visuel pour le raisonnement dans la génération vidéo

Post-entraînement des modèles multimodaux grands pour vidéos : une analyse approfondie du raisonnement vidéo à l’aide de modèles multimodaux grands

Paper2Video : génération automatique de vidéos à partir d'articles scientifiques

Ponctuer l'écart entre l'engagement et les performances pour la quantification FP4 en microéchelle

Amélioration autonome des grands modèles linguistiques multimodaux : une revue

Composez vos politiques ! Amélioration des politiques robotiques basées sur la diffusion ou sur les flux par composition au niveau de la distribution à l'heure du test

Les grands modèles de raisonnement apprennent une meilleure alignement à partir d'une pensée défectueuse

Modèles linguistiques massifs multi-modaux efficaces par distillation progressive de cohérence

Apriel-1.5-15b-Thinker

StockBench : Les agents basés sur les modèles linguistiques peuvent-ils trader des actions avec profit sur les marchés réels ?

Formation interactive : optimisation des réseaux de neurones pilotée par les retours

StealthAttack : Empoisonnement par projection de nuages de points 3D robuste basé sur des illusions guidées par la densité

ExGRPO : Apprendre à raisonner à partir de l'expérience

Self-Forcing++ : Vers une génération vidéo de haute qualité à l'échelle de la minute

LongCodeZip : Compression du contexte long pour les modèles linguistiques de code

PIPer : Configuration d'environnement sur dispositif par apprentissage par renforcement en ligne

Repenser les modèles de récompense pour le scaling à temps de test multi-domaines

Rapport technique Phi-3 : un modèle linguistique hautement performant fonctionnant localement sur votre téléphone

Rapport technique Qwen2.5

Découverte d'algorithmes scientifiques par l'augmentation d'AlphaEvolve avec une recherche approfondie

ConstraintLLM : un cadre neuro-symbolique pour la programmation par contraintes à l'échelle industrielle

Scaling des chaînes de raisonnement assistées par le code et des instructions pour le raisonnement des modèles

CoDA : Codage des ML par adaptation par diffusion

Fast-dLLM v2 : Modèle LLM à diffusion par blocs efficace

Moins, c'est mieux : un raisonnement récursif avec des réseaux réduits

Fathom-DeepResearch : Déverrouiller la recherche d'information et la synthèse à long terme pour les SLM

TaTToo : PRM fondé sur un outil pour le raisonnement à temps de test dans le raisonnement tabulaire

Architectures hybrides pour les modèles linguistiques : analyse systématique et insights sur la conception

MITS : Amélioration du raisonnement par recherche arborescente pour les LSM grâce à l'information mutuelle ponctuelle

Évasion imperceptible des grands modèles linguistiques

VChain : Chaîne de raisonnement visuel pour le raisonnement dans la génération vidéo

Post-entraînement des modèles multimodaux grands pour vidéos : une analyse approfondie du raisonnement vidéo à l’aide de modèles multimodaux grands

Paper2Video : génération automatique de vidéos à partir d'articles scientifiques

Ponctuer l'écart entre l'engagement et les performances pour la quantification FP4 en microéchelle

Amélioration autonome des grands modèles linguistiques multimodaux : une revue

Composez vos politiques ! Amélioration des politiques robotiques basées sur la diffusion ou sur les flux par composition au niveau de la distribution à l'heure du test

Les grands modèles de raisonnement apprennent une meilleure alignement à partir d'une pensée défectueuse

Modèles linguistiques massifs multi-modaux efficaces par distillation progressive de cohérence

Apriel-1.5-15b-Thinker

StockBench : Les agents basés sur les modèles linguistiques peuvent-ils trader des actions avec profit sur les marchés réels ?

Formation interactive : optimisation des réseaux de neurones pilotée par les retours

StealthAttack : Empoisonnement par projection de nuages de points 3D robuste basé sur des illusions guidées par la densité

ExGRPO : Apprendre à raisonner à partir de l'expérience

Self-Forcing++ : Vers une génération vidéo de haute qualité à l'échelle de la minute

LongCodeZip : Compression du contexte long pour les modèles linguistiques de code

PIPer : Configuration d'environnement sur dispositif par apprentissage par renforcement en ligne

Repenser les modèles de récompense pour le scaling à temps de test multi-domaines