Date

il y a 2 mois

Organisation

URL du document

2509.22647

Balises

Vision Par Ordinateur

CapRL a été proposé en septembre 2025 par une équipe de recherche de l'Université des sciences et technologies de Chine, de l'Université chinoise de Hong Kong et du Laboratoire d'intelligence artificielle de Shanghai, entre autres institutions. Les résultats de cette recherche ont été publiés dans l'article « ... ».CapRL : Stimuler les capacités de légende d'images denses grâce à l'apprentissage par renforcement".

CapRL est un nouveau cadre d'entraînement qui redéfinit la qualité des descriptions par son aspect pratique : des descriptions de haute qualité doivent permettre aux modèles de langage non visuels de répondre avec précision aux questions concernant l'image correspondante. Il utilise un processus découplé en deux étapes : un grand modèle de langage visuel (LVLM) génère la description, tandis que la récompense objective est basée sur la précision d'un autre grand modèle de langage non visuel (LLM) à répondre à des questions à choix multiples fondées sur cette description. Pré-entraîné sur l'ensemble de données de descriptions CapRL-5M annoté avec CapRL-3B, CapRL obtient des améliorations significatives sur 12 benchmarks. De plus, dans le cadre Prism d'évaluation de la qualité des descriptions, ses performances sont comparables à celles de Qwen2.5-VL-72B, surpassant la référence de 8,41 points TP3T en moyenne.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Date

il y a 2 mois

Organisation

URL du document

2509.22647

Balises

Vision Par Ordinateur

Associé Wiki

Cadre d'apprentissage Par Renforcement Mem-I

Mem-I a réalisé des améliorations significatives par rapport aux agents de référence existants dotés d'une mémoire améliorée dans de multiples tests d'évaluation.

il y a 2 mois

Cadre De Contrôle De Mise En Page InstanceAssemble

InstanceAssemble permet la génération d'images de haute qualité et contrôlables dans des conditions multimodales.

il y a 2 mois

Deviner – Réfléchir – Répondre

GTA surpasse nettement les méthodes de référence SFT standard et les méthodes RL de pointe dans de multiples benchmarks de classification de texte.

il y a 3 mois

RewardMap, Un Cadre d'apprentissage Par Renforcement Multi-étapes

RewardMap améliore les capacités des grands modèles de langage multimodaux dans les tâches de vision structurée.

il y a 2 mois

Contrôle De La Mise En Page - Mise En Page Vers Image

Layout-to-Image offre un mécanisme de contrôle flexible pour la génération d'images.

il y a 2 mois

Réseau De Mélange exponentiel-gaussien EGMN

EGMN a réussi à capturer les effets d'interaction potentiels entre les préférences des utilisateurs et les caractéristiques vidéo.

il y a 3 mois

Méthode De post-formation DiDi-Instruct

Le premier cadre à appliquer avec succès la distillation de correspondance de distribution à la génération de texte basée sur MDM, établissant un record dans la génération de séquences linguistiques en quelques étapes.

il y a 2 mois

Architecture MultiPL-MoE

MultiPL-MoE est une méthode efficace pour étendre les langages de programmation à faible source dans la phase de post-pré-entraînement.

il y a 2 mois

Cadre d'optimisation De La Stratégie Hybride HiPO

HiPO est utilisé pour l'inférence LLM adaptative, incluant principalement la construction de données hybrides et l'apprentissage par renforcement hybride.

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

CapRL Décrit l'apprentissage Par Renforcement

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

CapRL Décrit l'apprentissage Par Renforcement

Associé Wiki

Cadre d'apprentissage Par Renforcement Mem-I

Cadre De Contrôle De Mise En Page InstanceAssemble

Deviner – Réfléchir – Répondre

RewardMap, Un Cadre d'apprentissage Par Renforcement Multi-étapes

Contrôle De La Mise En Page - Mise En Page Vers Image

Réseau De Mélange exponentiel-gaussien EGMN

Méthode De post-formation DiDi-Instruct

Architecture MultiPL-MoE

Cadre d'optimisation De La Stratégie Hybride HiPO

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

CapRL Décrit l'apprentissage Par Renforcement

Associé Wiki

Cadre d'apprentissage Par Renforcement Mem-I

Cadre De Contrôle De Mise En Page InstanceAssemble

Deviner – Réfléchir – Répondre

RewardMap, Un Cadre d'apprentissage Par Renforcement Multi-étapes

Contrôle De La Mise En Page - Mise En Page Vers Image

Réseau De Mélange exponentiel-gaussien EGMN

Méthode De post-formation DiDi-Instruct

Architecture MultiPL-MoE

Cadre d'optimisation De La Stratégie Hybride HiPO

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Wiki

Cadre d'apprentissage Par Renforcement Mem-I

Cadre De Contrôle De Mise En Page InstanceAssemble

Deviner – Réfléchir – Répondre

RewardMap, Un Cadre d'apprentissage Par Renforcement Multi-étapes

Contrôle De La Mise En Page - Mise En Page Vers Image

Réseau De Mélange exponentiel-gaussien EGMN

Méthode De post-formation DiDi-Instruct

Architecture MultiPL-MoE

Cadre d'optimisation De La Stratégie Hybride HiPO

Associé Wiki

Cadre d'apprentissage Par Renforcement Mem-I

Cadre De Contrôle De Mise En Page InstanceAssemble

Deviner – Réfléchir – Répondre

RewardMap, Un Cadre d'apprentissage Par Renforcement Multi-étapes

Contrôle De La Mise En Page - Mise En Page Vers Image

Réseau De Mélange exponentiel-gaussien EGMN

Méthode De post-formation DiDi-Instruct

Architecture MultiPL-MoE

Cadre d'optimisation De La Stratégie Hybride HiPO