Command Palette
Search for a command to run...
Wiki
Nous avons compilé des centaines d'entrées connexes pour vous aider à comprendre "l'intelligence artificielle"
MetaFold peut gérer une variété de vêtements et une large gamme de commandes linguistiques, réalisant efficacement diverses tâches de pliage de vêtements.
ST-Raptor surpasse neuf modèles de base jusqu'à 20% en termes de précision de réponse.
SubLlME vise à obtenir une évaluation efficace et précise des performances du modèle grâce à la prédiction de la pertinence du classement sans nécessiter d'évaluation complète.
BSC-Nav construit une carte cognitive allocentrique à partir de trajectoires égocentriques et d'indices contextuels, et récupère dynamiquement des connaissances spatiales cohérentes avec des objectifs sémantiques.
Des expériences préliminaires montrent que le DPCL peut séparer la parole et obtenir des résultats relativement idéaux.
L’objectif du recuit bimode est de développer un modèle capable de saisir deux modes de réponse différents : le mode de pensée et le mode de non-pensée.
Le principe fondamental du BPO est d’apprendre des politiques adaptatives en comparant explicitement les utilités des chemins de réflexion et de non-réflexion sous la même requête d’entrée.
BED-LLM applique efficacement le cadre de conception expérimentale bayésienne séquentielle (BED) au problème de collecte d'informations interactives avec les LLM.
Comparé au modèle LLaMA et à d’autres modèles de base de pointe, REFRAG atteint une accélération significative sans perte de précision.
En tant que solution générale et légère, ATE améliore la praticité du déploiement de modèles VLA sur de nouvelles plates-formes et tâches robotiques.
MoC fournit un nouveau modèle pour la prochaine génération de modèles de génération vidéo à long terme évolutifs et contrôlables.
Le cadre TiG permet aux LLM de développer une compréhension procédurale en interagissant directement avec l'environnement du jeu tout en conservant leurs capacités inhérentes de raisonnement et d'interprétation.
LOVON vise à exploiter de grands modèles linguistiques pour la planification hiérarchique des tâches en conjonction avec un modèle de détection visuelle de vocabulaire ouvert.
MP1 est capable de générer directement des trajectoires de mouvement dans le cadre d'une seule évaluation de fonction réseau.
Meta-rater vise à intégrer les quatre dimensions de l'expertise, de la lisibilité, du raisonnement et de la propreté avec les indicateurs de qualité existants en apprenant les pondérations optimales.
MaCP vise à obtenir d'excellentes performances dans le réglage fin de modèles de grande base avec une surcharge minimale de paramètres et de mémoire.
L’ingénierie contextuelle marque une mise à niveau du paradigme dans la pratique du LLM, de « l’ingénierie rapide » à « l’ingénierie contextuelle » systématique.
L'apprentissage par imitation permet d'acquérir des stratégies en apprenant à partir de démonstrations d'experts
POET est un nouvel algorithme d'entraînement reparamétré
La NSA combine l’innovation algorithmique et l’optimisation matérielle pour obtenir une modélisation efficace à long contexte.
La navigation incarnée optimise les itinéraires de navigation en interagissant avec le monde physique via des objets en mouvement.
DiC est une architecture de base de modèle de diffusion qui combine vitesse et performance
PCEvolve est un nouvel algorithme assisté par API
Les EBT constituent un nouveau paradigme prometteur qui peut simultanément élargir les capacités d’apprentissage et de réflexion des modèles.