HyperAIHyperAI

Articles de recherche récents

Articles de recherche sur l'IA mis à jour quotidiennement pour vous aider à suivre les dernières tendances en matière d'IA

Seed Diffusion : un modèle linguistique de diffusion à grande échelle avec inférence à haute vitesse
Seed Diffusion : un modèle linguistique de diffusion à grande échelle avec inférence à haute vitesse
\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.
il y a 11 jours
Agent Lightning : Former N'IMPORTE QUELLE IA avec l'apprentissage par renforcement
Agent Lightning : Former N'IMPORTE QUELLE IA avec l'apprentissage par renforcement
Xufang Luo, Yuge Zhang, Zhiyuan He, et al.
il y a 11 jours
Découverte algorithmique automatisée pour la détection des ondes gravitationnelles guidée par une recherche arborescente de Monte Carlo évolutionnaire informée par des modèles linguistiques
Découverte algorithmique automatisée pour la détection des ondes gravitationnelles guidée par une recherche arborescente de Monte Carlo évolutionnaire informée par des modèles linguistiques
He Wang, Liang Zeng
il y a 11 jours
Au-delà du compromis : apprentissage par renforcement auto-supervisé pour la suivie d'instructions par les modèles de raisonnement
Au-delà du compromis : apprentissage par renforcement auto-supervisé pour la suivie d'instructions par les modèles de raisonnement
Qingyu Ren, Qianyu He, Bowei Zhang, et al.
il y a 12 jours
Rapport technique Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct
Rapport technique Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct
Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.
il y a 12 jours
CellForge : conception agente de modèles cellulaires virtuels
CellForge : conception agente de modèles cellulaires virtuels
Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.
il y a 12 jours
SitEmb-v1.5 : Récupération dense consciente du contexte améliorée pour l'association sémantique et la compréhension des longs récits
SitEmb-v1.5 : Récupération dense consciente du contexte améliorée pour l'association sémantique et la compréhension des longs récits
Junjie Wu, Jiangnan Li, Yuqing Li, et al.
il y a 12 jours
Rapport technique Qwen-Image
Rapport technique Qwen-Image
Chenfei Wu, Jiahao Li, Jingren Zhou, et al.
il y a 12 jours
RL-PLUS : Contrer la collapse de la frontière des capacités des MLG en apprentissage par renforcement par une optimisation hybride des politiques
RL-PLUS : Contrer la collapse de la frontière des capacités des MLG en apprentissage par renforcement par une optimisation hybride des politiques
Yihong Dong, Xue Jiang, Yongding Tao, et al.
il y a 12 jours
GS-Occ3D : Reprojection de l'occupation uniquement visuelle à grande échelle avec le splatting gaussien
GS-Occ3D : Reprojection de l'occupation uniquement visuelle à grande échelle avec le splatting gaussien
Baijun Ye, Minghui Qin, Saining Zhang, et al.
il y a 12 jours
SWE-Debate : Débat multi-agents compétitif pour la résolution des problèmes logiciels
SWE-Debate : Débat multi-agents compétitif pour la résolution des problèmes logiciels
Han Li, Yuling Shi, Shaoxin Lin, et al.
il y a 13 jours
Segmentation de référence multimodale : une revue
Segmentation de référence multimodale : une revue
Henghui Ding, Song Tang, Shuting He, et al.
il y a 13 jours
3D-R1 : Amélioration du raisonnement dans les VLM 3D pour une compréhension unifiée des scènes
3D-R1 : Amélioration du raisonnement dans les VLM 3D pour une compréhension unifiée des scènes
Ting Huang, Zeyu Zhang, Hao Tang
il y a 13 jours
SWE-Exp : Résolution de problèmes logiciels pilotée par l'expérience
SWE-Exp : Résolution de problèmes logiciels pilotée par l'expérience
Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.
il y a 13 jours
PixNerd : Diffusion des champs neuronaux de pixels
PixNerd : Diffusion des champs neuronaux de pixels
Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.
il y a 13 jours
Au-delà du fixe : débruitage à longueur variable pour les grands modèles linguistiques à diffusion
Au-delà du fixe : débruitage à longueur variable pour les grands modèles linguistiques à diffusion
Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.
il y a 13 jours
Cognitive Kernel-Pro : un cadre pour les agents de recherche approfondie et l'entraînement des modèles fondamentaux d'agents
Cognitive Kernel-Pro : un cadre pour les agents de recherche approfondie et l'entraînement des modèles fondamentaux d'agents
Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.
il y a 13 jours
Co-production de l’IA : vers un cycle de vie augmenté et participatif
Co-production de l’IA : vers un cycle de vie augmenté et participatif
Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.
il y a 13 jours
iLRM : un modèle itératif de reconstruction 3D de grande taille
iLRM : un modèle itératif de reconstruction 3D de grande taille
Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.
il y a 14 jours
villa-X : Amélioration de la modélisation des actions latentes dans les modèles vision-langage-action
villa-X : Amélioration de la modélisation des actions latentes dans les modèles vision-langage-action
Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.
il y a 14 jours
C3 : Une base de données bilingue pour les modèles de dialogue parlé explorant les défis posés par les conversations complexes
C3 : Une base de données bilingue pour les modèles de dialogue parlé explorant les défis posés par les conversations complexes
Chengqian Ma, Wei Tao, Yiwen Guo
il y a 14 jours
Rapport technique de RecGPT
Rapport technique de RecGPT
Chao Yi, Dian Chen, Gaoyang Guo, et al.
il y a 14 jours
Rapport technique de Phi-Ground : Progresser dans la perception de l'alignement GUI
Rapport technique de Phi-Ground : Progresser dans la perception de l'alignement GUI
Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.
il y a 14 jours
Seed-Prover : raisonnement profond et large pour la démonstration automatique de théorèmes
Seed-Prover : raisonnement profond et large pour la démonstration automatique de théorèmes
Luoxin Chen, Jinming Gu, Liankai Huang, et al.
il y a 14 jours
Sélection de ReLU locale versus globale : la MILP partielle fait son retour pour la vérification des réseaux de neurones profonds
Sélection de ReLU locale versus globale : la MILP partielle fait son retour pour la vérification des réseaux de neurones profonds
Yuke Liao, Blaise Genest, Kuldeep Meel, et al.
il y a 16 jours
CoT-Self-Instruct : Construction de promts synthétiques de haute qualité pour les tâches de raisonnement et non de raisonnement
CoT-Self-Instruct : Construction de promts synthétiques de haute qualité pour les tâches de raisonnement et non de raisonnement
Ping Yu, Jack Lanchantin, Tianlu Wang, et al.
il y a 16 jours
Vers des expressions et raisonnements omnimodaux dans la segmentation audio-visuelle par référence
Vers des expressions et raisonnements omnimodaux dans la segmentation audio-visuelle par référence
Kaining Ying, Henghui Ding, Guanquan Jie, et al.
il y a 17 jours
Adaptation de détecteurs de véhicules pour des images aériennes à des domaines inédits avec une supervision faible
Adaptation de détecteurs de véhicules pour des images aériennes à des domaines inédits avec une supervision faible
Xiao Fang, Minhyek Jeon, Zheyang Qin, et al.
il y a 17 jours
VL-Cogito : apprentissage par renforcement avec programme progressif pour le raisonnement multimodal avancé
VL-Cogito : apprentissage par renforcement avec programme progressif pour le raisonnement multimodal avancé
Ruifeng Yuan, Chenghao Xiao, Sicong Leng, et al.
il y a 17 jours
Falcon-H1 : une famille de modèles linguistiques à tête hybride redéfinissant l'efficacité et les performances
Falcon-H1 : une famille de modèles linguistiques à tête hybride redéfinissant l'efficacité et les performances
Jingwei Zuo, Maksim Velikanov, Ilyas Chahed, et al.
il y a 17 jours