HyperAI

Docs
Actualités
Articles de recherche
Tutoriels
Ensembles de données
Wiki
SOTA
Modèles LLM
Classement GPU
Événements

À propos Conditions d'utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

Wiki

Nous avons compilé des centaines d'entrées connexes pour vous aider à comprendre "l'intelligence artificielle"

Construire l'avenir de l'intelligence artificielle

Français

À propos

À propos de nous Aide aux ensembles de données

Produits

Actualités Tutoriels Ensembles de données Wiki

Liens

© HyperAI

Discord X (formerly Twitter)

Wiki | HyperAI

Attention Causale

L'attention causale (CATT) est un mécanisme d'attention innovant qui améliore l'interprétabilité et les performances du modèle en incorporant l'inférence causale, en particulier dans les tâches de vision-langage. Ce mécanisme a été découvert par des chercheurs de l'Université technologique de Nanyang et de l'Université Monash en Australie en 20 [...]

Arbre Des Pensées

Les arbres de pensée généralisent l’approche populaire de l’enchaînement de pensées pour inciter à des modèles de langage et permettent l’exploration d’unités de texte cohérentes (pensées) comme étapes intermédiaires dans la résolution de problèmes.

Architecture Du MoMa

L'architecture MoMa est une nouvelle architecture de mélange d'experts (MoE) prenant en compte les modalités, conçue pour la pré-formation de modèles de langage à modalités mixtes et à fusion précoce.

Minimisation Des Erreurs En Plusieurs Étapes

La minimisation des erreurs en plusieurs étapes (MEM) a été publiée en 2024 par l'Institut d'ingénierie de l'information de l'Académie chinoise des sciences, l'Université technologique de Nanyang, l'Université nationale de Singapour et l'Université Sun Yat-sen dans l'article « Multimodal Unlearnable E […]

Conjecture Géométrique De Langlands

La conjecture géométrique de Langlands est une version géométrique du programme de Langlands.

Programme Langlands

Le programme Langlands est un domaine de recherche très influent dans les mathématiques modernes. Il implique plusieurs branches des mathématiques, telles que la théorie des nombres, la géométrie algébrique et la théorie des représentations de groupe, et tente de révéler les liens profonds entre elles.

Circuit Intégré Spécifique À l'application ASIC

Un circuit intégré spécifique à une application (ASIC) est un circuit intégré conçu et fabriqué selon les exigences spécifiques des utilisateurs et les besoins d'un système électronique spécifique.

Horloge Murale

Le temps d'horloge murale est un terme utilisé pour mesurer le temps d'exécution d'un programme ou d'un processus. Il s'agit du temps réel écoulé entre le début et la fin de l'exécution du programme, y compris tous les types de temps d'attente et de blocage.

Front De Pareto

Le front de Pareto est un concept clé de l'optimisation multi-objectifs, qui fait référence à un ensemble de solutions permettant d'obtenir le meilleur compromis entre plusieurs objectifs.

Foulée

Stride est un terme souvent utilisé dans le traitement d'images et les réseaux neuronaux convolutifs (CNN). Dans le contexte du traitement d'image, la foulée fait référence au nombre d'étapes que la fenêtre d'exploitation parcourt sur l'image lors de l'application d'une opération à l'image, telle que le recadrage, l'extraction de caractéristiques ou le filtrage. Par exemple, lors du recadrage d’une image, […]

Invites Dynamiques

Dynamic Prompts est une technologie d'invite qui permet d'ajuster dynamiquement les invites en fonction de tâches ou d'instances spécifiques dans le traitement du langage naturel (NLP) et d'autres applications d'intelligence artificielle. Cette technique peut améliorer considérablement les performances et l’adaptabilité du modèle. Dynamique […]

Algorithme De Suivi multi-cibles SORT

Simple Online and Realtime Tracking (SORT) est une méthode de suivi multi-cibles pratique qui se concentre sur des algorithmes simples et efficaces. Il a été présenté par des chercheurs de l'Université de technologie du Queensland et de l'Université de Sydney lors de la Conférence internationale IEEE 2016 sur le traitement d'images. […]

Relecture d'expérience Prioritaire

La relecture d'expériences prioritaires est une méthode d'apprentissage par renforcement qui rejoue les expériences à différentes fréquences en fonction de leur importance, améliorant ainsi l'efficacité de l'apprentissage.

Chaîne De Pensée

La technologie CoT décompose les problèmes complexes en une série de réponses aux sous-problèmes étape par étape, guidant le modèle pour générer un processus de raisonnement détaillé, améliorant ainsi les performances du modèle sur des tâches complexes telles que le raisonnement arithmétique, le raisonnement de bon sens et le raisonnement symbolique.

Réglage Fin Efficace Des Paramètres

Le réglage fin efficace des paramètres (PERT) est une méthode de réglage fin pour les grands modèles pré-entraînés qui réduit les coûts de calcul et de stockage en ajustant uniquement un petit sous-ensemble de paramètres du modèle tout en maintenant des performances comparables à un réglage fin des paramètres complets.

Modèles Mondiaux

Dans le domaine de l’intelligence artificielle, un « modèle du monde » est un modèle qui permet de caractériser l’état de l’environnement ou du monde et de prédire les transitions entre les états. Ce modèle permet à l’agent d’apprendre dans un environnement simulé et de transférer les stratégies apprises au monde réel, améliorant ainsi l’efficacité de l’apprentissage et réduisant les risques. Jürgen S […]

Apprentissage Contrastif Multimodal Avec Sélection Conjointe d'exemples (JEST)

L'apprentissage contrastif multimodal avec sélection d'exemples conjoints (JEST) vise à résoudre le problème de consommation d'énergie élevée lors de la formation de grands modèles de langage tels que ChatGPT.

Réglage Complet Des Paramètres

Le réglage complet des paramètres est une technique d'optimisation de modèle dans l'apprentissage profond, particulièrement utilisée dans les scénarios d'apprentissage par transfert ou d'adaptation de domaine. Il s’agit d’affiner tous les paramètres d’un modèle pré-entraîné pour l’adapter à une tâche ou à un ensemble de données spécifique.

Réseau d'occupation

Le réseau d'occupation joue un rôle important dans les tâches de perception de la conduite autonome. Il s’agit d’un modèle de réseau qui se concentre sur la géométrie plutôt que sur la sémantique. Il peut aider les systèmes de conduite autonome à mieux percevoir l’espace libre et constitue une technologie clé pour améliorer les capacités de perception et former une boucle fermée.

Réalignement Du Temps De Décodage

L'idée principale du réalignement pendant le décodage est d'ajuster dynamiquement l'alignement du modèle pendant le processus de décodage sans recycler le modèle, économisant ainsi des ressources informatiques et améliorant l'efficacité de la recherche.

Éclaboussures Gaussiennes 3D

La technologie d'éclaboussure gaussienne tridimensionnelle est une technologie d'infographie avancée, qui a des applications importantes dans le rendu de nuages de points, la visualisation de données de volume et la reconstruction de volume. Cette technologie permet d'obtenir des rendus de meilleure qualité en convertissant des points de données discrets, ou voxels, en une représentation de surface ou de volume continue.

Test Du Mode Ombre

Le test en mode ombre est une méthode de test utilisée dans le domaine de la conduite autonome. Il est principalement utilisé pour vérifier et évaluer les algorithmes de conduite autonome dans des environnements de trafic réels tout en garantissant qu'il n'interfère pas avec le conducteur et le trafic environnant.

Malédiction De La Rareté

Le fléau de la rareté est un problème scientifique clé dans le domaine de la conduite autonome. Cela fait référence au fait que dans les environnements de conduite réels, la probabilité d'événements critiques pour la sécurité est extrêmement faible, ce qui fait que ces événements sont extrêmement rares dans les données de conduite, ce qui rend difficile pour les modèles d'apprentissage en profondeur d'apprendre les caractéristiques de ces événements.

Perte Par Diffusion

La perte de diffusion est une fonction de perte liée au modèle de diffusion, qui est utilisée pendant le processus de formation pour guider le modèle afin d'apprendre à supprimer progressivement le bruit et à restaurer la structure d'origine des données.