HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Studio
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

Articles de recherche en IA de pointe mis à jour quotidiennement pour vous aider à suivre les dernières tendances en IA

Construire l’avenir de l’intelligence artificielle

À propos

À propos Support Aide relative au jeu de données

Produits

Actualités Publications de recherche Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

Voir le texte : De la tokenisation à la lecture visuelle

Ling Xing, Alex Jinpeng Wang, Rui Yan, et al.

Injection de raisonnement directionnel pour le fine-tuning des MLLM

Réponse À Des Questions Visuelles

Chao Huang, Zeliang Zhang, Jiang Liu, et al.

Les modèles de langage sont injectifs et par conséquent inversibles

Les modèles de langage sont injectifs et par conséquent inversibles

Traitement Du Langage Naturel

Giorgos Nikolaou, Tommaso Mencattini, Donato Crisostomi, et al.

Le Transformer libre

François Fleuret

Prédiction du temps de traitement d'une unité de traitement quantique (QPU) par apprentissage automatique

Apprentissage Automatique

Entraînement Du Modèle

Lucy Xing, Sanjay Vishwakarma, David Kremer, et al.

Observation de l'interférence constructive au voisinage de l'ergodicité quantique

IA Pour La Science

Google Quantum AI and Collaborators

VideoAgentTrek : Pré-entraînement à l'utilisation de l'ordinateur à partir de vidéos non étiquetées

Reconnaissance D'action

Interaction Homme-Machine

Dunjie Lu, Yiheng Xu, Junli Wang, et al.

GigaBrain-0 : un modèle vision-langage-action alimenté par un monde modélisé

Intelligence Incarnée

GigaBrain Team, Angen Ye, Boyuan Wang, et al.

LoongRL : Apprentissage par renforcement pour un raisonnement avancé sur des contextes longs

Siyuan Wang, Gaokai Zhang, Li Lyna Zhang, et al.

BAPO : Stabilisation de l'apprentissage par renforcement hors politique pour les modèles de langage grâce à l'optimisation de politique équilibrée avec découpage adaptatif

Apprentissage Par Renforcement

Zhiheng Xi, Xin Guo, Yang Nan, et al.

Chaque attention compte : une architecture hybride efficace pour le raisonnement à longue portée

Entraînement Du Modèle

Ling Team, Bin Han, Caizhi Tang, et al.

Color Me Correctly : Rebrancher les espaces colorés perceptifs et les embeddings textuels pour une génération de diffusion améliorée

Inpainting D'image

Modèle De Diffusion

Sung-Lin Tsai, Bo-Lun Huang, Yu Ting Shen, et al.

Raisonnement spatial avec des modèles vision-langage dans des scènes multi-vues en perspective subjective

Réponse À Des Questions Visuelles

Mohsen Gholami, Ahmad Rezaei, Zhou Weimin, et al.

LoFT : Une fine-tuning efficace en paramètres pour l'apprentissage semi-supervisé à longue queue dans des scénarios à monde ouvert

Affinage Supervisé

Reconnaissance D'images

Jiahao Chen, Zhiyuan Huang, Yurou Liu, et al.

FLOWER : Démocratiser les politiques robotiques généralistes grâce à des politiques efficaces de flux vision-langage-action

Moritz Reuss, Hongyi Zhou, Marcel Rühle, et al.

Optimisation de politique guidée par le remplissage pour les modèles de langage à grande échelle à diffusion

Apprentissage Par Renforcement

Modèle De Diffusion

Siyan Zhao, Mengchen Liu, Jing Huang, et al.

MCP-AgentBench : Évaluation des performances des agents linguistiques dans le monde réel à l'aide d'outils pilotés par MCP

Zikang Guo, Benfeng Xu, Chiwei Zhu, et al.

Une revue des méthodes de mémoire cache dans les modèles de diffusion : vers une génération multi-modale efficace

Modèle De Diffusion

Jiacheng Liu, Xinyu Wang, Yuqi Lin, et al.

Repenser le modèle du monde de conduite comme générateur de données synthétiques pour les tâches de perception

Génération De Vidéo

Conduite Autonome

Kai Zeng, Zhanqian Wu, Kaixin Xiong, et al.

Autofocus à variation spatiale

Estimation De Profondeur

Vision Par Ordinateur

Yingsi Qin, Aswin C. Sankaranarayanan, Matthew O'Toole

Quand agréger : identification de points au niveau des jetons pour une agrégation de LLM stable et rapide

Heecheol Yun, Kwangmin Ki, Junghyun Lee, et al.

Vers une recherche mixte de modalités pour une génération augmentée par la recherche universelle

Génération Augmentée Par La Recherche

Chenghao Zhang, Guanting Dong, Xinyu Yang, et al.

FineVision : Les données ouvertes, c'est tout ce dont vous avez besoin

Luis Wiedmann, Orr Zohar, Amir Mahla, et al.

Glyph : Augmenter la taille des fenêtres contextuelles par compression visuelle et textuelle

Réponse À Des Questions Visuelles

Compréhension De Document

Jiale Cheng, Yusen Liu, Xinyu Zhang, et al.

PICABench : Où en sommes-nous en matière de modification d'images physiquement réaliste ?

Inpainting D'image

Yuandong Pu, Le Zhuo, Songhao Han, et al.

DeepAnalyze : modèles de langage à grande échelle agents pour la science des données autonome

Shaolei Zhang, Ju Fan, Meihao Fan, et al.

Attention auto-associative pour l'apprentissage des opérateurs dans la simulation thermique 3D-IC

IA Pour La Science

Zhen Huang, Hong Wang, Wenkai Yang, et al.

Terre IA : Déverrouiller des informations géospatiales grâce aux modèles fondamentaux et au raisonnement multimodal

Aaron Bell, Amit Aides, Amr Helmy, et al.

Repenser les écarts interlinguistiques du point de vue statistique

Traitement Du Langage Naturel

Vihari Piratla, Purvam Jain, Darshan Singh, et al.

Libérer le raisonnement scientifique pour la génération de protocoles d'expérimentation biologique à l'aide d'un mécanisme de récompense structuré basé sur des composants

Haoran Sun, Yankai Jiang, Zhenyu Tang, et al.

Skyfall-GS : Synthèse de scènes urbaines 3D immersives à partir d'images satellitaires

Génération 3D

Modèle De Diffusion

Jie-Ying Lee, Yi-Ruei Liu, Shr-Ruei Tsai, et al.

Désalignement émergent par apprentissage in-situ : des exemples in-situ restreints peuvent entraîner des LLM largement désalignés

Nikita Afonin, Nikita Andriyanov, Nikhil Bageshpura, et al.

Voir le texte : De la tokenisation à la lecture visuelle

Ling Xing, Alex Jinpeng Wang, Rui Yan, et al.

Injection de raisonnement directionnel pour le fine-tuning des MLLM

Réponse À Des Questions Visuelles

Chao Huang, Zeliang Zhang, Jiang Liu, et al.

Les modèles de langage sont injectifs et par conséquent inversibles

Les modèles de langage sont injectifs et par conséquent inversibles

Traitement Du Langage Naturel

Giorgos Nikolaou, Tommaso Mencattini, Donato Crisostomi, et al.

Le Transformer libre

François Fleuret

Prédiction du temps de traitement d'une unité de traitement quantique (QPU) par apprentissage automatique

Apprentissage Automatique

Entraînement Du Modèle

Lucy Xing, Sanjay Vishwakarma, David Kremer, et al.

Observation de l'interférence constructive au voisinage de l'ergodicité quantique

IA Pour La Science

Google Quantum AI and Collaborators

VideoAgentTrek : Pré-entraînement à l'utilisation de l'ordinateur à partir de vidéos non étiquetées

Reconnaissance D'action

Interaction Homme-Machine

Dunjie Lu, Yiheng Xu, Junli Wang, et al.

GigaBrain-0 : un modèle vision-langage-action alimenté par un monde modélisé

Intelligence Incarnée

GigaBrain Team, Angen Ye, Boyuan Wang, et al.

LoongRL : Apprentissage par renforcement pour un raisonnement avancé sur des contextes longs

Siyuan Wang, Gaokai Zhang, Li Lyna Zhang, et al.

BAPO : Stabilisation de l'apprentissage par renforcement hors politique pour les modèles de langage grâce à l'optimisation de politique équilibrée avec découpage adaptatif

Apprentissage Par Renforcement

Zhiheng Xi, Xin Guo, Yang Nan, et al.

Chaque attention compte : une architecture hybride efficace pour le raisonnement à longue portée

Entraînement Du Modèle

Ling Team, Bin Han, Caizhi Tang, et al.

Color Me Correctly : Rebrancher les espaces colorés perceptifs et les embeddings textuels pour une génération de diffusion améliorée

Inpainting D'image

Modèle De Diffusion

Sung-Lin Tsai, Bo-Lun Huang, Yu Ting Shen, et al.

Raisonnement spatial avec des modèles vision-langage dans des scènes multi-vues en perspective subjective

Réponse À Des Questions Visuelles

Mohsen Gholami, Ahmad Rezaei, Zhou Weimin, et al.

LoFT : Une fine-tuning efficace en paramètres pour l'apprentissage semi-supervisé à longue queue dans des scénarios à monde ouvert

Affinage Supervisé

Reconnaissance D'images

Jiahao Chen, Zhiyuan Huang, Yurou Liu, et al.

FLOWER : Démocratiser les politiques robotiques généralistes grâce à des politiques efficaces de flux vision-langage-action

Moritz Reuss, Hongyi Zhou, Marcel Rühle, et al.

Optimisation de politique guidée par le remplissage pour les modèles de langage à grande échelle à diffusion

Apprentissage Par Renforcement

Modèle De Diffusion

Siyan Zhao, Mengchen Liu, Jing Huang, et al.

MCP-AgentBench : Évaluation des performances des agents linguistiques dans le monde réel à l'aide d'outils pilotés par MCP

Zikang Guo, Benfeng Xu, Chiwei Zhu, et al.

Une revue des méthodes de mémoire cache dans les modèles de diffusion : vers une génération multi-modale efficace

Modèle De Diffusion

Jiacheng Liu, Xinyu Wang, Yuqi Lin, et al.

Repenser le modèle du monde de conduite comme générateur de données synthétiques pour les tâches de perception

Génération De Vidéo

Conduite Autonome

Kai Zeng, Zhanqian Wu, Kaixin Xiong, et al.

Autofocus à variation spatiale

Estimation De Profondeur

Vision Par Ordinateur

Yingsi Qin, Aswin C. Sankaranarayanan, Matthew O'Toole

Quand agréger : identification de points au niveau des jetons pour une agrégation de LLM stable et rapide

Heecheol Yun, Kwangmin Ki, Junghyun Lee, et al.

Vers une recherche mixte de modalités pour une génération augmentée par la recherche universelle

Génération Augmentée Par La Recherche

Chenghao Zhang, Guanting Dong, Xinyu Yang, et al.

FineVision : Les données ouvertes, c'est tout ce dont vous avez besoin

Luis Wiedmann, Orr Zohar, Amir Mahla, et al.

Glyph : Augmenter la taille des fenêtres contextuelles par compression visuelle et textuelle

Réponse À Des Questions Visuelles

Compréhension De Document

Jiale Cheng, Yusen Liu, Xinyu Zhang, et al.

PICABench : Où en sommes-nous en matière de modification d'images physiquement réaliste ?

Inpainting D'image

Yuandong Pu, Le Zhuo, Songhao Han, et al.

DeepAnalyze : modèles de langage à grande échelle agents pour la science des données autonome

Shaolei Zhang, Ju Fan, Meihao Fan, et al.

Attention auto-associative pour l'apprentissage des opérateurs dans la simulation thermique 3D-IC

IA Pour La Science

Zhen Huang, Hong Wang, Wenkai Yang, et al.

Terre IA : Déverrouiller des informations géospatiales grâce aux modèles fondamentaux et au raisonnement multimodal

Aaron Bell, Amit Aides, Amr Helmy, et al.

Repenser les écarts interlinguistiques du point de vue statistique

Traitement Du Langage Naturel

Vihari Piratla, Purvam Jain, Darshan Singh, et al.

Libérer le raisonnement scientifique pour la génération de protocoles d'expérimentation biologique à l'aide d'un mécanisme de récompense structuré basé sur des composants

Haoran Sun, Yankai Jiang, Zhenyu Tang, et al.

Skyfall-GS : Synthèse de scènes urbaines 3D immersives à partir d'images satellitaires

Génération 3D

Modèle De Diffusion

Jie-Ying Lee, Yi-Ruei Liu, Shr-Ruei Tsai, et al.

Désalignement émergent par apprentissage in-situ : des exemples in-situ restreints peuvent entraîner des LLM largement désalignés

Nikita Afonin, Nikita Andriyanov, Nikhil Bageshpura, et al.

Le Transformer libre

Prédiction du temps de traitement d'une unité de traitement quantique (QPU) par apprentissage automatique

Observation de l'interférence constructive au voisinage de l'ergodicité quantique

VideoAgentTrek : Pré-entraînement à l'utilisation de l'ordinateur à partir de vidéos non étiquetées

GigaBrain-0 : un modèle vision-langage-action alimenté par un monde modélisé

LoongRL : Apprentissage par renforcement pour un raisonnement avancé sur des contextes longs

BAPO : Stabilisation de l'apprentissage par renforcement hors politique pour les modèles de langage grâce à l'optimisation de politique équilibrée avec découpage adaptatif

Chaque attention compte : une architecture hybride efficace pour le raisonnement à longue portée

Color Me Correctly : Rebrancher les espaces colorés perceptifs et les embeddings textuels pour une génération de diffusion améliorée

Raisonnement spatial avec des modèles vision-langage dans des scènes multi-vues en perspective subjective

LoFT : Une fine-tuning efficace en paramètres pour l'apprentissage semi-supervisé à longue queue dans des scénarios à monde ouvert

FLOWER : Démocratiser les politiques robotiques généralistes grâce à des politiques efficaces de flux vision-langage-action

Optimisation de politique guidée par le remplissage pour les modèles de langage à grande échelle à diffusion

MCP-AgentBench : Évaluation des performances des agents linguistiques dans le monde réel à l'aide d'outils pilotés par MCP

Une revue des méthodes de mémoire cache dans les modèles de diffusion : vers une génération multi-modale efficace

Repenser le modèle du monde de conduite comme générateur de données synthétiques pour les tâches de perception

Autofocus à variation spatiale

Quand agréger : identification de points au niveau des jetons pour une agrégation de LLM stable et rapide

Vers une recherche mixte de modalités pour une génération augmentée par la recherche universelle

FineVision : Les données ouvertes, c'est tout ce dont vous avez besoin

Glyph : Augmenter la taille des fenêtres contextuelles par compression visuelle et textuelle

PICABench : Où en sommes-nous en matière de modification d'images physiquement réaliste ?

DeepAnalyze : modèles de langage à grande échelle agents pour la science des données autonome

Attention auto-associative pour l'apprentissage des opérateurs dans la simulation thermique 3D-IC

Terre IA : Déverrouiller des informations géospatiales grâce aux modèles fondamentaux et au raisonnement multimodal

Repenser les écarts interlinguistiques du point de vue statistique

Libérer le raisonnement scientifique pour la génération de protocoles d'expérimentation biologique à l'aide d'un mécanisme de récompense structuré basé sur des composants

Skyfall-GS : Synthèse de scènes urbaines 3D immersives à partir d'images satellitaires

Désalignement émergent par apprentissage in-situ : des exemples in-situ restreints peuvent entraîner des LLM largement désalignés

Le Transformer libre

Prédiction du temps de traitement d'une unité de traitement quantique (QPU) par apprentissage automatique

Observation de l'interférence constructive au voisinage de l'ergodicité quantique

VideoAgentTrek : Pré-entraînement à l'utilisation de l'ordinateur à partir de vidéos non étiquetées

GigaBrain-0 : un modèle vision-langage-action alimenté par un monde modélisé

LoongRL : Apprentissage par renforcement pour un raisonnement avancé sur des contextes longs

BAPO : Stabilisation de l'apprentissage par renforcement hors politique pour les modèles de langage grâce à l'optimisation de politique équilibrée avec découpage adaptatif

Chaque attention compte : une architecture hybride efficace pour le raisonnement à longue portée

Color Me Correctly : Rebrancher les espaces colorés perceptifs et les embeddings textuels pour une génération de diffusion améliorée

Raisonnement spatial avec des modèles vision-langage dans des scènes multi-vues en perspective subjective

LoFT : Une fine-tuning efficace en paramètres pour l'apprentissage semi-supervisé à longue queue dans des scénarios à monde ouvert

FLOWER : Démocratiser les politiques robotiques généralistes grâce à des politiques efficaces de flux vision-langage-action

Optimisation de politique guidée par le remplissage pour les modèles de langage à grande échelle à diffusion

MCP-AgentBench : Évaluation des performances des agents linguistiques dans le monde réel à l'aide d'outils pilotés par MCP

Une revue des méthodes de mémoire cache dans les modèles de diffusion : vers une génération multi-modale efficace

Repenser le modèle du monde de conduite comme générateur de données synthétiques pour les tâches de perception

Autofocus à variation spatiale

Quand agréger : identification de points au niveau des jetons pour une agrégation de LLM stable et rapide

Vers une recherche mixte de modalités pour une génération augmentée par la recherche universelle

FineVision : Les données ouvertes, c'est tout ce dont vous avez besoin

Glyph : Augmenter la taille des fenêtres contextuelles par compression visuelle et textuelle

PICABench : Où en sommes-nous en matière de modification d'images physiquement réaliste ?

DeepAnalyze : modèles de langage à grande échelle agents pour la science des données autonome

Attention auto-associative pour l'apprentissage des opérateurs dans la simulation thermique 3D-IC

Terre IA : Déverrouiller des informations géospatiales grâce aux modèles fondamentaux et au raisonnement multimodal

Repenser les écarts interlinguistiques du point de vue statistique

Libérer le raisonnement scientifique pour la génération de protocoles d'expérimentation biologique à l'aide d'un mécanisme de récompense structuré basé sur des composants

Skyfall-GS : Synthèse de scènes urbaines 3D immersives à partir d'images satellitaires

Désalignement émergent par apprentissage in-situ : des exemples in-situ restreints peuvent entraîner des LLM largement désalignés