HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Combien les modèles de langage mémorisent-ils ?

Combien les modèles de langage mémorisent-ils ?

Entraînement Du Modèle

John X. Morris, Chawin Sitawarin, Chuan Guo, et al.

L'Atlas de l'obscurcissement : Cartographier là où l'honnêteté émerge dans le RLVR à l'aide de sondes de tromperie

L'Atlas de l'obscurcissement : Cartographier là où l'honnêteté émerge dans le RLVR à l'aide de sondes de tromperie

Apprentissage Par Renforcement

Mohammad Taufeeque, Stefan Heimersheim, Adam Gleave, et al.

Position : La communauté de l’alignement construit involontairement une boîte à outils pour censeurs

Affinage Supervisé

Sarah Ball, Phil Hackemann

Échantillonnage de haute précision pour les modèles de diffusion et les distributions log-concaves

Modèle De Diffusion

Fan Chen, Sinho Chewi, Constantinos Daskalakis, et al.

AgenticDataBench : un banc d'essai complet pour les agents de données

Zhaoyan Sun, Shan Zhong, Daizhou Wen, et al.

FLUX DE CORRESPONDANCE MULTIRÉSOLUTION : ACCÉLÉRATION DE DIFFUSION SANS ENTRAÎNEMENT PAR ÉCHANTILLONNAGE ÉTAGÉ

Texte Vers Image

Modèle De Diffusion

Xingyu Zheng, Xianglong Liu, Yifu Ding, et al.

Se transformer en modèles d'attention hybrides

Apprentissage Profond

Disen Lan, Jianbin Zheng, Yuxi Ren, et al.

EvoPolicyGym : Évaluation de l'évolution autonome des politiques dans des environnements interactifs

Apprentissage Par Renforcement

Zhilin Wang, Han Song, Runzhe Zhan, et al.

AgenticSTS : un banc d’essai à mémoire bornée pour agents LLM à long horizon

Xiangchen Cheng, Yunwei Jiang, Jianwen Sun, et al.

Program-as-Weights : un paradigme de programmation pour les fonctions floues

Génération De Code

Wentao Zhang, Liliana Hotsko, Woojeong Kim, et al.

MatAnyone 2 : Passage à l'échelle du matage vidéo via un évaluateur de qualité appris

Traitement Vidéo

Segmentation D'images

Peiqing Yang, Shangchen Zhou, Kai Hao, et al.

EdgeTAM : un modèle « Segment Anything » sur appareil

Segmentation D'images

Chong Zhou, Chenchen Zhu, Yunyang Xiong, et al.

PixelRefer : Un cadre unifié pour la référence spatio-temporelle d'objets à granularité arbitraire

Représentation Multimodale

Yuqian Yuan, Wenqiao Zhang, Xin Li, et al.

EdgeBench : Dévoiler les lois d'échelle de l'apprentissage à partir d'environnements réels

Apprentissage Par Renforcement

Deyao Zhu, Xin Zhou, Shengling Qin, et al.

ASPIRE : Découverte agentique de compétences pour la robotique

Runyu Lu, Yubo Wu, Ethan Kou, et al.

AUTOMEM : Apprentissage automatisé de la mémoire en tant que compétence cognitive

Entraînement Du Modèle

Shengguang Wu, Hao Zhu, Yuhui Zhang, et al.

La loi du travail de décodage : jointures spatiales exactes et prouvables, régies par la marge, sur géométrie compressée

Information Géographique

Madhulatha Mandarapu, Sandeep Kunkunuru

Tarification neuronale de certificats pour les problèmes d'optimisation combinatoire

Apprentissage Profond

Jingyi Chen, Xinyuan Zhang, Xinwu Qian

Utilisation optimale des ressources pour les orchestrateurs de laboratoires autonomes

IA Pour La Science

Austin McDannald, Julia Tisaranni, Howie Joress

TERA : Un cadre unifié d'analyse d'atteignabilité fondé sur les modèles de Taylor

Salma Iraky, Andrew Sogokon

Perceive-to-Reason : Découpler la perception et le raisonnement pour le raisonnement visuel fin

Réponse À Des Questions Visuelles

Hongxing Li, Xiufeng Huang, Dingming Li, et al.

Plans d'expériences basés sur des tries pour une évaluation efficace des pipelines de recherche d'information

Irene Anu, Craig Macdonald

Sur la non-linéarité de la loi d'échelle du taux d'apprentissage pour l'entraînement des LLM

Entraînement Du Modèle

Zaiwen Yang, Huaqing Zhang, Jing Xu, et al.

Les scènes comme objets, non comme primitives : tokenisation 3D structurée par instances à partir de vues non recalées

Génération 3D

Vision Machine 3D

Mijin Yoo, In Cho, Subin Jeon, et al.

BlockPilot : apprentissage de politique adaptative par instance pour le décodage spéculatif basé sur la diffusion

Modèle De Diffusion

Hao Zhang, Yiming Hu, Yong Wang, et al.

DOPD : Distillation double en politique

Xinlei Yu, Gen Li, Qingyi Si, et al.

Dockerless : Vérificateur de programmes sans environnement pour agents de codage

Affinage Supervisé

Wenhao Zeng, Yuling Shi, Xiaodong Gu, et al.

Orca : Le monde est dans votre esprit

Génération De Texte

Orca Team, Yihao Wang, Yuheng Ji, et al.

MegaTrain : Entraînement en pleine précision de grands modèles de langage de plus de 100 milliards de paramètres sur un seul GPU

Entraînement Du Modèle

Zhengqing Yuan, Hanchi Sun, Lichao Sun, et al.

Trouver le temps de réfléchir : apprentissage des budgets de planification en RL temps réel

Apprentissage Par Renforcement

Aneesh Muppidi, Firas Darwish, Dylan Cope, et al.

À quoi ressemblent les courbes de taux d'apprentissage quasi optimales ?

Apprentissage Profond

Entraînement Du Modèle

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, et al.

Au-delà de l'IID : Dans quelle mesure les modèles tabulaires fondamentaux sont-ils vraiment généraux ?

Jeu De Données

Lennart Purucker, Andrej Tschalzev, Nick Erickson, et al.

Combien les modèles de langage mémorisent-ils ?

Combien les modèles de langage mémorisent-ils ?

Entraînement Du Modèle

John X. Morris, Chawin Sitawarin, Chuan Guo, et al.

L'Atlas de l'obscurcissement : Cartographier là où l'honnêteté émerge dans le RLVR à l'aide de sondes de tromperie

L'Atlas de l'obscurcissement : Cartographier là où l'honnêteté émerge dans le RLVR à l'aide de sondes de tromperie

Apprentissage Par Renforcement

Mohammad Taufeeque, Stefan Heimersheim, Adam Gleave, et al.

Position : La communauté de l’alignement construit involontairement une boîte à outils pour censeurs

Affinage Supervisé

Sarah Ball, Phil Hackemann

Échantillonnage de haute précision pour les modèles de diffusion et les distributions log-concaves

Modèle De Diffusion

Fan Chen, Sinho Chewi, Constantinos Daskalakis, et al.

AgenticDataBench : un banc d'essai complet pour les agents de données

Zhaoyan Sun, Shan Zhong, Daizhou Wen, et al.

FLUX DE CORRESPONDANCE MULTIRÉSOLUTION : ACCÉLÉRATION DE DIFFUSION SANS ENTRAÎNEMENT PAR ÉCHANTILLONNAGE ÉTAGÉ

Texte Vers Image

Modèle De Diffusion

Xingyu Zheng, Xianglong Liu, Yifu Ding, et al.

Se transformer en modèles d'attention hybrides

Apprentissage Profond

Disen Lan, Jianbin Zheng, Yuxi Ren, et al.

EvoPolicyGym : Évaluation de l'évolution autonome des politiques dans des environnements interactifs

Apprentissage Par Renforcement

Zhilin Wang, Han Song, Runzhe Zhan, et al.

AgenticSTS : un banc d’essai à mémoire bornée pour agents LLM à long horizon

Xiangchen Cheng, Yunwei Jiang, Jianwen Sun, et al.

Program-as-Weights : un paradigme de programmation pour les fonctions floues

Génération De Code

Wentao Zhang, Liliana Hotsko, Woojeong Kim, et al.

MatAnyone 2 : Passage à l'échelle du matage vidéo via un évaluateur de qualité appris

Traitement Vidéo

Segmentation D'images

Peiqing Yang, Shangchen Zhou, Kai Hao, et al.

EdgeTAM : un modèle « Segment Anything » sur appareil

Segmentation D'images

Chong Zhou, Chenchen Zhu, Yunyang Xiong, et al.

PixelRefer : Un cadre unifié pour la référence spatio-temporelle d'objets à granularité arbitraire

Représentation Multimodale

Yuqian Yuan, Wenqiao Zhang, Xin Li, et al.

EdgeBench : Dévoiler les lois d'échelle de l'apprentissage à partir d'environnements réels

Apprentissage Par Renforcement

Deyao Zhu, Xin Zhou, Shengling Qin, et al.

ASPIRE : Découverte agentique de compétences pour la robotique

Runyu Lu, Yubo Wu, Ethan Kou, et al.

AUTOMEM : Apprentissage automatisé de la mémoire en tant que compétence cognitive

Entraînement Du Modèle

Shengguang Wu, Hao Zhu, Yuhui Zhang, et al.

La loi du travail de décodage : jointures spatiales exactes et prouvables, régies par la marge, sur géométrie compressée

Information Géographique

Madhulatha Mandarapu, Sandeep Kunkunuru

Tarification neuronale de certificats pour les problèmes d'optimisation combinatoire

Apprentissage Profond

Jingyi Chen, Xinyuan Zhang, Xinwu Qian

Utilisation optimale des ressources pour les orchestrateurs de laboratoires autonomes

IA Pour La Science

Austin McDannald, Julia Tisaranni, Howie Joress

TERA : Un cadre unifié d'analyse d'atteignabilité fondé sur les modèles de Taylor

Salma Iraky, Andrew Sogokon

Perceive-to-Reason : Découpler la perception et le raisonnement pour le raisonnement visuel fin

Réponse À Des Questions Visuelles

Hongxing Li, Xiufeng Huang, Dingming Li, et al.

Plans d'expériences basés sur des tries pour une évaluation efficace des pipelines de recherche d'information

Irene Anu, Craig Macdonald

Sur la non-linéarité de la loi d'échelle du taux d'apprentissage pour l'entraînement des LLM

Entraînement Du Modèle

Zaiwen Yang, Huaqing Zhang, Jing Xu, et al.

Les scènes comme objets, non comme primitives : tokenisation 3D structurée par instances à partir de vues non recalées

Génération 3D

Vision Machine 3D

Mijin Yoo, In Cho, Subin Jeon, et al.

BlockPilot : apprentissage de politique adaptative par instance pour le décodage spéculatif basé sur la diffusion

Modèle De Diffusion

Hao Zhang, Yiming Hu, Yong Wang, et al.

DOPD : Distillation double en politique

Xinlei Yu, Gen Li, Qingyi Si, et al.

Dockerless : Vérificateur de programmes sans environnement pour agents de codage

Affinage Supervisé

Wenhao Zeng, Yuling Shi, Xiaodong Gu, et al.

Orca : Le monde est dans votre esprit

Génération De Texte

Orca Team, Yihao Wang, Yuheng Ji, et al.

MegaTrain : Entraînement en pleine précision de grands modèles de langage de plus de 100 milliards de paramètres sur un seul GPU

Entraînement Du Modèle

Zhengqing Yuan, Hanchi Sun, Lichao Sun, et al.

Trouver le temps de réfléchir : apprentissage des budgets de planification en RL temps réel

Apprentissage Par Renforcement

Aneesh Muppidi, Firas Darwish, Dylan Cope, et al.

À quoi ressemblent les courbes de taux d'apprentissage quasi optimales ?

Apprentissage Profond

Entraînement Du Modèle

Hiroki Naganuma, Atish Agarwala, Priya Kasimbeg, et al.

Au-delà de l'IID : Dans quelle mesure les modèles tabulaires fondamentaux sont-ils vraiment généraux ?

Jeu De Données

Lennart Purucker, Andrej Tschalzev, Nick Erickson, et al.

Position : La communauté de l’alignement construit involontairement une boîte à outils pour censeurs

Échantillonnage de haute précision pour les modèles de diffusion et les distributions log-concaves

AgenticDataBench : un banc d'essai complet pour les agents de données

FLUX DE CORRESPONDANCE MULTIRÉSOLUTION : ACCÉLÉRATION DE DIFFUSION SANS ENTRAÎNEMENT PAR ÉCHANTILLONNAGE ÉTAGÉ

Se transformer en modèles d'attention hybrides

EvoPolicyGym : Évaluation de l'évolution autonome des politiques dans des environnements interactifs

AgenticSTS : un banc d’essai à mémoire bornée pour agents LLM à long horizon

Program-as-Weights : un paradigme de programmation pour les fonctions floues

MatAnyone 2 : Passage à l'échelle du matage vidéo via un évaluateur de qualité appris

EdgeTAM : un modèle « Segment Anything » sur appareil

PixelRefer : Un cadre unifié pour la référence spatio-temporelle d'objets à granularité arbitraire

EdgeBench : Dévoiler les lois d'échelle de l'apprentissage à partir d'environnements réels

ASPIRE : Découverte agentique de compétences pour la robotique

AUTOMEM : Apprentissage automatisé de la mémoire en tant que compétence cognitive

La loi du travail de décodage : jointures spatiales exactes et prouvables, régies par la marge, sur géométrie compressée

Tarification neuronale de certificats pour les problèmes d'optimisation combinatoire

Utilisation optimale des ressources pour les orchestrateurs de laboratoires autonomes

TERA : Un cadre unifié d'analyse d'atteignabilité fondé sur les modèles de Taylor

Perceive-to-Reason : Découpler la perception et le raisonnement pour le raisonnement visuel fin

Plans d'expériences basés sur des tries pour une évaluation efficace des pipelines de recherche d'information

Sur la non-linéarité de la loi d'échelle du taux d'apprentissage pour l'entraînement des LLM

Les scènes comme objets, non comme primitives : tokenisation 3D structurée par instances à partir de vues non recalées

BlockPilot : apprentissage de politique adaptative par instance pour le décodage spéculatif basé sur la diffusion

DOPD : Distillation double en politique

Dockerless : Vérificateur de programmes sans environnement pour agents de codage

Orca : Le monde est dans votre esprit

MegaTrain : Entraînement en pleine précision de grands modèles de langage de plus de 100 milliards de paramètres sur un seul GPU

Trouver le temps de réfléchir : apprentissage des budgets de planification en RL temps réel

À quoi ressemblent les courbes de taux d'apprentissage quasi optimales ?

Au-delà de l'IID : Dans quelle mesure les modèles tabulaires fondamentaux sont-ils vraiment généraux ?

Position : La communauté de l’alignement construit involontairement une boîte à outils pour censeurs

Échantillonnage de haute précision pour les modèles de diffusion et les distributions log-concaves

AgenticDataBench : un banc d'essai complet pour les agents de données

FLUX DE CORRESPONDANCE MULTIRÉSOLUTION : ACCÉLÉRATION DE DIFFUSION SANS ENTRAÎNEMENT PAR ÉCHANTILLONNAGE ÉTAGÉ

Se transformer en modèles d'attention hybrides

EvoPolicyGym : Évaluation de l'évolution autonome des politiques dans des environnements interactifs

AgenticSTS : un banc d’essai à mémoire bornée pour agents LLM à long horizon

Program-as-Weights : un paradigme de programmation pour les fonctions floues

MatAnyone 2 : Passage à l'échelle du matage vidéo via un évaluateur de qualité appris

EdgeTAM : un modèle « Segment Anything » sur appareil

PixelRefer : Un cadre unifié pour la référence spatio-temporelle d'objets à granularité arbitraire

EdgeBench : Dévoiler les lois d'échelle de l'apprentissage à partir d'environnements réels

ASPIRE : Découverte agentique de compétences pour la robotique

AUTOMEM : Apprentissage automatisé de la mémoire en tant que compétence cognitive

La loi du travail de décodage : jointures spatiales exactes et prouvables, régies par la marge, sur géométrie compressée

Tarification neuronale de certificats pour les problèmes d'optimisation combinatoire

Utilisation optimale des ressources pour les orchestrateurs de laboratoires autonomes

TERA : Un cadre unifié d'analyse d'atteignabilité fondé sur les modèles de Taylor

Perceive-to-Reason : Découpler la perception et le raisonnement pour le raisonnement visuel fin

Plans d'expériences basés sur des tries pour une évaluation efficace des pipelines de recherche d'information

Sur la non-linéarité de la loi d'échelle du taux d'apprentissage pour l'entraînement des LLM

Les scènes comme objets, non comme primitives : tokenisation 3D structurée par instances à partir de vues non recalées

BlockPilot : apprentissage de politique adaptative par instance pour le décodage spéculatif basé sur la diffusion

DOPD : Distillation double en politique

Dockerless : Vérificateur de programmes sans environnement pour agents de codage

Orca : Le monde est dans votre esprit

MegaTrain : Entraînement en pleine précision de grands modèles de langage de plus de 100 milliards de paramètres sur un seul GPU

Trouver le temps de réfléchir : apprentissage des budgets de planification en RL temps réel

À quoi ressemblent les courbes de taux d'apprentissage quasi optimales ?

Au-delà de l'IID : Dans quelle mesure les modèles tabulaires fondamentaux sont-ils vraiment généraux ?