HyperAIHyperAI

Command Palette

Search for a command to run...

Rapport Hebdomadaire Sur l'IA | Développement d'agents Généraux / Détection d'objets / Modèles d'inférence Physique Open source... Découvrez Les Dernières Avancées En IA Dans Un Seul article.

Featured Image

Ces dernières années, le développement des grands modèles de langage (GML) a repoussé les frontières de la recherche, passant de la résolution d'énigmes au raisonnement scientifique – c'est-à-dire à la capacité de traiter des problèmes complexes où les réponses doivent être confrontées aux lois de la nature, et non plus seulement à des critères d'évaluation. La physique illustre le mieux cette évolution, car elle relie fondamentalement les systèmes symboliques au monde réel et constitue la pierre angulaire de la plupart des technologies modernes.

S’appuyant sur ces travaux, une équipe de recherche du Laboratoire d’intelligence artificielle de Shanghai a fait progresser la recherche en physique en développant des modèles de langage à grande échelle dotés de capacités de raisonnement physique exceptionnelles, notamment pour la résolution de problèmes de niveau olympique. Les chercheurs ont proposé la série P1 de modèles de raisonnement physique open source, entièrement entraînés par apprentissage par renforcement (RL). Parmi eux, P1-235B-A22B est le premier modèle open source à avoir obtenu une médaille d’or aux Olympiades internationales de physique de 2025 (IPhO 2025), et a remporté 12 médailles d’or dans 13 compétitions internationales et régionales de physique entre 2024 et 2025.

Lien vers le document:https://go.hyper.ai/NxT8f

Derniers articles sur l'IA:https://go.hyper.ai/hzChC

Afin de permettre à davantage d'utilisateurs de connaître les derniers développements dans le domaine de l'intelligence artificielle dans le milieu universitaire, le site Web officiel d'HyperAI (hyper.ai) a désormais lancé une section « Derniers articles », qui met à jour quotidiennement les articles de recherche de pointe sur l'IA.Voici 5 articles populaires sur l'IA que nous recommandons, jetons un coup d’œil rapide aux réalisations de pointe en matière d’IA de cette semaine⬇️

Recommandation de papier de cette semaine

1. Lumine : une recette ouverte pour créer des agents généralistes dans un monde ouvert 3D

Cet article présente Lumine, la première solution de développement d'agents open source à usage général capable d'exécuter des tâches complexes pendant des heures en temps réel dans des environnements 3D complexes en monde ouvert. Lumine adopte un paradigme d'interaction similaire à celui de l'humain, unifiant perception, raisonnement et action de bout en bout grâce à un modèle vision-langage. Il traite les entrées de pixels bruts à une fréquence de 5 images par seconde, génère des actions précises au clavier et à la souris à 30 images par seconde et invoque dynamiquement le module d'inférence uniquement lorsque cela est nécessaire.

Lien vers le document:https://go.hyper.ai/wfGhN

Présentation du modèle Lumine

2. YOLOv13 : Détection d’objets en temps réel avec perception visuelle adaptative améliorée par hypergraphe

Cet article présente YOLOv13, un détecteur d'objets léger et de haute précision. Les chercheurs proposent également HyperACE, un mécanisme d'amélioration adaptative des corrélations basé sur les hypergraphes, qui exploite de manière adaptative les corrélations d'ordre supérieur potentielles, surmontant ainsi les limitations des méthodes précédentes qui se limitaient à la modélisation des corrélations par paires à partir du calcul d'hypergraphes. Ce mécanisme permet une fusion et une amélioration efficaces des caractéristiques à l'échelle et à l'échelle globales.

Lien vers le document:https://go.hyper.ai/cKMGI

Diagramme d'architecture du modèle

3. Générer une image à partir de 1 000 mots Améliorer la conversion texte-image grâce à des légendes structurées

Cet article présente FIBO, le premier modèle open source de conversion texte-image basé sur de longues descriptions structurées, où chaque exemple d'entraînement est étiqueté avec le même ensemble d'attributs précis. Cette conception accroît considérablement la puissance expressive et permet un contrôle indépendant des facteurs visuels. Pour traiter efficacement les longues descriptions, les chercheurs proposent le mécanisme DimFusion : une méthode de fusion qui permet de combiner les jetons intermédiaires d'un modèle de langage léger et étendu (LLM) sans augmenter la longueur des jetons.

Lien vers l'article :https://go.hyper.ai/zyUcE

Flux de travail FIBO

4. Depth Anything 3 : Récupérer l’espace visuel à partir de n’importe quelle vue

Cet article propose Depth Anything 3 (DA3), un modèle capable de prédire une géométrie spatialement cohérente à partir d'un nombre quelconque d'entrées visuelles, indépendamment du fait que ces entrées contiennent ou non des poses de caméra connues. Les chercheurs ont construit un nouveau banc d'essai de géométrie visuelle couvrant l'estimation de la pose de la caméra, la reconstruction géométrique depuis des points de vue arbitraires et le rendu visuel. Sur ce banc d'essai, DA3 atteint des performances de pointe inédites pour toutes les tâches, avec une amélioration moyenne de 44,31 TP3T pour la précision de l'estimation de la pose de la caméra et de 25,11 TP3T pour la précision de la reconstruction géométrique par rapport à la méthode de référence précédente, VGGT.

Lien vers le document:https://go.hyper.ai/WvSU4

Diagramme de flux de travail

5. P1 : Maîtriser les Olympiades de physique grâce à l’apprentissage par renforcement

Cet article fait progresser la recherche en physique en développant des modèles de langage à grande échelle dotés de capacités de raisonnement physique supérieures, notamment pour la résolution de problèmes de niveau olympique. Nous proposons la série P1 de modèles de raisonnement physique open source, entièrement entraînés par apprentissage par renforcement (RL).

Lien vers le document:https://go.hyper.ai/NxT8f

Un échantillon des données d'entraînement

Voici l'intégralité du contenu de la recommandation d'article de cette semaine. Pour découvrir d'autres articles de recherche de pointe en IA, veuillez consulter la section « Derniers articles » du site officiel d'hyper.ai.

Nous invitons également les équipes de recherche à nous soumettre des résultats et des articles de haute qualité. Les personnes intéressées peuvent ajouter leur compte WeChat NeuroStar (identifiant WeChat : Hyperai01).

À la semaine prochaine !