Command Palette
Search for a command to run...
Wiki
Machine Learning Glossary: Explore definitions and explanations of key AI and ML concepts
VLM peut réaliser des tâches de compréhension, de raisonnement et de génération intermodales en alignant et en fusionnant les informations d'image et de texte.
VLA peut générer des mouvements de robot directement à partir d'images visuelles et de commandes verbales.
La statistique NSG quantifie le rapport entre le gradient de probabilité spatiale et la variation temporelle de la densité.
Mem-I a réalisé des améliorations significatives par rapport aux agents de référence existants dotés d'une mémoire améliorée dans de multiples tests d'évaluation.
SSP démontre le potentiel de la théorie des jeux auto-initiés en tant que paradigme d'entraînement évolutif et économe en données pour l'apprentissage automatique par modélisation d'agents.
CudaForge est un flux de travail multi-agents simple, efficace et peu coûteux pour la génération et l'optimisation de noyaux CUDA.
FractalForensics présente une bonne robustesse et une bonne vulnérabilité aux opérations courantes de traitement d'images et aux opérations Deepfake.
ScaleNet est une approche novatrice qui étend le Visual Transformer (ViT) pré-entraîné grâce au partage de poids.
FlashMoBA rend pratique la taille de bloc théoriquement optimale, atteignant une accélération jusqu'à 14,7x sur les GPU.
Le détournement CoT est une nouvelle méthode d'attaque par jailbreak dans laquelle un raisonnement bienveillant affaiblit systématiquement le comportement de rejet.
InstanceAssemble permet la génération d'images de haute qualité et contrôlables dans des conditions multimodales.
Layout-to-Image offre un mécanisme de contrôle flexible pour la génération d'images.
HiPO est utilisé pour l'inférence LLM adaptative, incluant principalement la construction de données hybrides et l'apprentissage par renforcement hybride.
Ce nouveau cadre de travail, sensible à la sémantique, est utilisé pour reconstruire des modèles 3D à partir de vues éparses.
L’AEPO se concentre sur l’équilibrage et la rationalisation des branches d’extension de stratégie et des mises à jour de stratégie sous la direction d’appels d’outils à haute entropie.
SDAR établit un nouveau paradigme pratique de modélisation du langage qui unifie les avantages complémentaires de l'autorégression et de la diffusion.
C2C permet une communication sémantique directe en transformant et en fusionnant les caches clé-valeur (KV) entre les modèles.
CapRL permet d'entraîner efficacement des modèles à générer des descriptions d'images plus générales et plus précises.
Le modèle approxime la machine de Gödel dans un environnement d'agent de codage et guide l'expansion par le biais d'un échantillonnage de Thompson avec une planification adaptative.
Le premier cadre à appliquer avec succès la distillation de correspondance de distribution à la génération de texte basée sur MDM, établissant un record dans la génération de séquences linguistiques en quelques étapes.
MultiPL-MoE est une méthode efficace pour étendre les langages de programmation à faible source dans la phase de post-pré-entraînement.
L'équipe de Tongyi Qianwen a étudié de manière systématique le rôle des mécanismes de contrôle dans l'attention softmax standard.
Le framework Lancelot intègre un chiffrement entièrement homomorphe dans BRFL pour obtenir une protection robuste de la vie privée.
En alignant conjointement les caractéristiques globales et locales, les exemples adverses peuvent être efficacement guidés vers la distribution de caractéristiques cible et la transférabilité peut être améliorée.
VLM peut réaliser des tâches de compréhension, de raisonnement et de génération intermodales en alignant et en fusionnant les informations d'image et de texte.
VLA peut générer des mouvements de robot directement à partir d'images visuelles et de commandes verbales.
La statistique NSG quantifie le rapport entre le gradient de probabilité spatiale et la variation temporelle de la densité.
Mem-I a réalisé des améliorations significatives par rapport aux agents de référence existants dotés d'une mémoire améliorée dans de multiples tests d'évaluation.
SSP démontre le potentiel de la théorie des jeux auto-initiés en tant que paradigme d'entraînement évolutif et économe en données pour l'apprentissage automatique par modélisation d'agents.
CudaForge est un flux de travail multi-agents simple, efficace et peu coûteux pour la génération et l'optimisation de noyaux CUDA.
FractalForensics présente une bonne robustesse et une bonne vulnérabilité aux opérations courantes de traitement d'images et aux opérations Deepfake.
ScaleNet est une approche novatrice qui étend le Visual Transformer (ViT) pré-entraîné grâce au partage de poids.
FlashMoBA rend pratique la taille de bloc théoriquement optimale, atteignant une accélération jusqu'à 14,7x sur les GPU.
Le détournement CoT est une nouvelle méthode d'attaque par jailbreak dans laquelle un raisonnement bienveillant affaiblit systématiquement le comportement de rejet.
InstanceAssemble permet la génération d'images de haute qualité et contrôlables dans des conditions multimodales.
Layout-to-Image offre un mécanisme de contrôle flexible pour la génération d'images.
HiPO est utilisé pour l'inférence LLM adaptative, incluant principalement la construction de données hybrides et l'apprentissage par renforcement hybride.
Ce nouveau cadre de travail, sensible à la sémantique, est utilisé pour reconstruire des modèles 3D à partir de vues éparses.
L’AEPO se concentre sur l’équilibrage et la rationalisation des branches d’extension de stratégie et des mises à jour de stratégie sous la direction d’appels d’outils à haute entropie.
SDAR établit un nouveau paradigme pratique de modélisation du langage qui unifie les avantages complémentaires de l'autorégression et de la diffusion.
C2C permet une communication sémantique directe en transformant et en fusionnant les caches clé-valeur (KV) entre les modèles.
CapRL permet d'entraîner efficacement des modèles à générer des descriptions d'images plus générales et plus précises.
Le modèle approxime la machine de Gödel dans un environnement d'agent de codage et guide l'expansion par le biais d'un échantillonnage de Thompson avec une planification adaptative.
Le premier cadre à appliquer avec succès la distillation de correspondance de distribution à la génération de texte basée sur MDM, établissant un record dans la génération de séquences linguistiques en quelques étapes.
MultiPL-MoE est une méthode efficace pour étendre les langages de programmation à faible source dans la phase de post-pré-entraînement.
L'équipe de Tongyi Qianwen a étudié de manière systématique le rôle des mécanismes de contrôle dans l'attention softmax standard.
Le framework Lancelot intègre un chiffrement entièrement homomorphe dans BRFL pour obtenir une protection robuste de la vie privée.
En alignant conjointement les caractéristiques globales et locales, les exemples adverses peuvent être efficacement guidés vers la distribution de caractéristiques cible et la transférabilité peut être améliorée.