HyperAIHyperAI

Articles de recherche récents

Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

PLAME : Utilisation des Modèles de Langue Préentraînés pour Générer des Alignements Multiples de Protéines Améliorés
PLAME : Utilisation des Modèles de Langue Préentraînés pour Générer des Alignements Multiples de Protéines Améliorés
Hanqun Cao, Xinyi Zhou, Zijun Gao, et al.
il y a un mois
CriticLean : Apprentissage par renforcement guidé par un critique pour la formalisation mathématique
CriticLean : Apprentissage par renforcement guidé par un critique pour la formalisation mathématique
Zhongyuan Peng, Yifan Yao, Kaijing Ma, et al.
il y a un mois
StreamVLN : Navigation Vision-Langue en Streaming via la Modélisation du Contexte SlowFast
StreamVLN : Navigation Vision-Langue en Streaming via la Modélisation du Contexte SlowFast
Meng Wei, Chenyang Wan, Xiqian Yu, et al.
il y a un mois
OmniPart : Génération 3D prenant en compte les parties avec découplage sémantique et cohésion structurelle
OmniPart : Génération 3D prenant en compte les parties avec découplage sémantique et cohésion structurelle
Yunhan Yang, Yufan Zhou, Yuan-Chen Guo, et al.
il y a un mois
SingLoRA : Adaptation de Rang Faible Utilisant une Seule Matrice
SingLoRA : Adaptation de Rang Faible Utilisant une Seule Matrice
David Bensa\u00efd, Noam Rotstein, Roy Velich, et al.
il y a un mois
Une revue sur le raisonnement latent
Une revue sur le raisonnement latent
Rui-Jie Zhu, Tianhao Peng, Tianhao Cheng, et al.
il y a un mois
Agent KB : Exploiter l'expérience interdomaines pour la résolution de problèmes agentenelle
Agent KB : Exploiter l'expérience interdomaines pour la résolution de problèmes agentenelle
Xiangru Tang, Tianrui Qin, Tianhao Peng, et al.
il y a un mois
ChipSeek-R1 : Génération de RTL surpassant les capacités humaines par apprentissage par renforcement hiérarchique guidé par des récompenses
ChipSeek-R1 : Génération de RTL surpassant les capacités humaines par apprentissage par renforcement hiérarchique guidé par des récompenses
Zhirong Chen, Kaiyan Chang, Zhuolin Li, et al.
il y a un mois
Rapport technique de MedGemma
Rapport technique de MedGemma
Andrew Sellergren, Sahar Kazemzadeh, Tiam Jaroensri, et al.
il y a un mois
BMMR : Un grand ensemble de données bilingue multimodal multidisciplinaire pour le raisonnement
BMMR : Un grand ensemble de données bilingue multimodal multidisciplinaire pour le raisonnement
Zhiheng Xi, Guanyu Li, Yutao Fan, et al.
il y a un mois
Les Discriminateurs de Politiques Pré-Entraînés sont des Modèles de Récompense Généraux
Les Discriminateurs de Politiques Pré-Entraînés sont des Modèles de Récompense Généraux
Shihan Dou, Shichun Liu, Yuming Yang, et al.
il y a un mois
DreamVLA : Un Modèle Vision-Langage-Action Rêvé avec une Connaissance Mondiale Compréhensive
DreamVLA : Un Modèle Vision-Langage-Action Rêvé avec une Connaissance Mondiale Compréhensive
Wenyao Zhang, Hongsi Liu, Zekun Qi, et al.
il y a un mois
4DSloMo : Reconstruction 4D de scènes à haute vitesse avec capture asynchrone
4DSloMo : Reconstruction 4D de scènes à haute vitesse avec capture asynchrone
Yutian Chen, Shi Guo, Tianshuo Yang, et al.
il y a un mois
Devrions-Nous Toujours Préformer les Encodeurs avec le Masquage de Langue ?
Devrions-Nous Toujours Préformer les Encodeurs avec le Masquage de Langue ?
Hippolyte Gisserot-Boukhlef, Nicolas Boizard, Manuel Faysse, et al.
il y a un mois
MemOS : Un Système d'Exploitation Mémoire pour les Systèmes IA
MemOS : Un Système d'Exploitation Mémoire pour les Systèmes IA
Zhiyu Li, Shichao Song, Chenyang Xi, et al.
il y a un mois
OGF : Une Méthode de Flux de Gradient en Ligne pour l'Optimisation des Moyennes Statistiques à État Stationnaire des Écoulements Turbulents Instationnaires
OGF : Une Méthode de Flux de Gradient en Ligne pour l'Optimisation des Moyennes Statistiques à État Stationnaire des Écoulements Turbulents Instationnaires
Tom Hickling, Jonathan F. MacArt, Justin Sirignano, et al.
il y a un mois
OpenS2S : Avancer vers un modèle de langage vocal empathique open-source de bout en bout
OpenS2S : Avancer vers un modèle de langage vocal empathique open-source de bout en bout
Chen Wang, Tianyu Peng, Wen Yang, et al.
il y a un mois
Point3R : Reconstruction 3D en temps réel avec mémoire de pointeur spatial explicite
Point3R : Reconstruction 3D en temps réel avec mémoire de pointeur spatial explicite
Yuqi Wu, Wenzhao Zheng, Jie Zhou, et al.
il y a un mois
StepHint : Des indices guidés en plusieurs niveaux améliorent l'apprentissage par renforcement pour la raisonnement
StepHint : Des indices guidés en plusieurs niveaux améliorent l'apprentissage par renforcement pour la raisonnement
Kaiyi Zhang, Ang Lv, Jinpeng Li, et al.
il y a un mois
Établir les meilleures pratiques pour la construction de benchmarks rigoureux et agencés
Établir les meilleures pratiques pour la construction de benchmarks rigoureux et agencés
Yuxuan Zhu, Tengjun Jin, Yada Pruksachatkun, et al.
il y a un mois
À Quelle Extent GPT-4o Comprend-il la Vision ? Évaluation des Modèles Fondamentaux Multimodaux sur les Tâches Standard de Vision par Ordinateur
À Quelle Extent GPT-4o Comprend-il la Vision ? Évaluation des Modèles Fondamentaux Multimodaux sur les Tâches Standard de Vision par Ordinateur
Rahul Ramachandran, Ali Garjani, Roman Bachmann, et al.
il y a un mois
Eka-Eval : Un Cadre d'Évaluation Complet pour les Grands Modèles de Langue en Langues Indiennes
Eka-Eval : Un Cadre d'Évaluation Complet pour les Grands Modèles de Langue en Langues Indiennes
Samridhi Raj Sinha, Rajvee Sheth, Abhishek Upperwal, et al.
il y a un mois
DynamiCare : Un Cadre Dynamique Multi-Agents pour la Prise de Décisions Médicales Interactive et Ouverte
DynamiCare : Un Cadre Dynamique Multi-Agents pour la Prise de Décisions Médicales Interactive et Ouverte
Tianqi Shang, Weiqing He, Charles Zheng, et al.
il y a un mois
Les Transformers basés sur l'énergie sont des apprenants et des penseurs évolutifs.
Les Transformers basés sur l'énergie sont des apprenants et des penseurs évolutifs.
Alexi Gladstone, Ganesh Nanduru, Md Mofijul Islam, et al.
il y a un mois
IntFold : Un modèle fondamental contrôlable pour la prédiction de la structure biomoléculaire générale et spécialisée
IntFold : Un modèle fondamental contrôlable pour la prédiction de la structure biomoléculaire générale et spécialisée
The IntFold Team, Leon Qiao, Wayne Bai, et al.
il y a un mois
Écouter la Voix Intérieure : Alignement de l'Entraînement de ControlNet par le Biais des Caractéristiques Intermédiaires
Écouter la Voix Intérieure : Alignement de l'Entraînement de ControlNet par le Biais des Caractéristiques Intermédiaires
Nina Konovalova, Maxim Nikolaev, Andrey Kuznetsov, et al.
il y a un mois
Skywork-Reward-V2 : Échelle de curation des données de préférence par synergie humain-IA
Skywork-Reward-V2 : Échelle de curation des données de préférence par synergie humain-IA
Chris Yuhao Liu, Liang Zeng, Yuzhen Xiao, et al.
il y a un mois
LangScene-X : Reconstruire des scènes linguistiques 3D généralisables avec la diffusion vidéo TriMap
LangScene-X : Reconstruire des scènes linguistiques 3D généralisables avec la diffusion vidéo TriMap
Fangfu Liu, Hao Li, Jiawei Chi, et al.
il y a un mois
Penser avec des images pour le raisonnement multimodal : fondements, méthodes et frontières futures
Penser avec des images pour le raisonnement multimodal : fondements, méthodes et frontières futures
Zhaochen Su, Peng Xia, Hangyu Guo, et al.
il y a un mois
WebSailor : Navigation de la Raison Supra-humaine pour un Agent Web
WebSailor : Navigation de la Raison Supra-humaine pour un Agent Web
Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.
il y a un mois