Wiki
Wir haben Hunderte von verwandten Einträgen zusammengestellt, um Ihnen zu helfen, "künstliche Intelligenz" zu verstehen
D-MoLE ist eine neuartige Methode zur kontinuierlichen Feinabstimmung multimodaler Anweisungen
M+ verbessert die Fähigkeit, Informationen langfristig zu behalten, erheblich
AI Flow verbessert die Intelligenz, Reaktionsfähigkeit und Zugänglichkeit von KI-Diensten
SparseMM priorisiert und bewahrt die visuelle Semantik während der Dekodierung
MAS ist ein Computersystem, das aus mehreren Agenten besteht, die in einer Umgebung interagieren.
CTC ist eine Verlustfunktion und Modellierungsmethode, die häufig bei Sequenz-zu-Sequenz-Lernaufgaben verwendet wird.
Der gemeinsame Wissenssatz des Suchbaums ist ein von Google DeepMind vorgeschlagener Suchalgorithmus
VeBrain ermöglicht Robotern „sehen, denken, handeln“
BCM spielt eine wichtige Rolle bei der Förderung der Entwicklung industrieller Defekterkennungstechnologie.
Maschinelles Vergessen erfüllt Bedürfnisse wie Datenschutz, gesetzliche Anforderungen oder Urheberrechtsschutz.
Grafting ist eine einfache Möglichkeit, einen vortrainierten Diffusion Transformer (DiT) zu bearbeiten.
PENCIL zielt darauf ab, großen Modellen das dynamische Löschen unnötiger Zwischenergebnisse während des Generierungsprozesses zu ermöglichen, bis die endgültige Antwort vorliegt.
RAP ist ein hochauflösendes Bildwahrnehmungs-Plugin basierend auf der RAG-Technologie, das kein Training erfordert.
Die Wortfehlerrate ist ein wichtiger Indikator zur Bewertung der Leistung von Spracherkennungs- oder Textabgleichsystemen.
Mit der Sprecherähnlichkeit soll gemessen werden, ob zwei Sprachproben vom selben Sprecher stammen oder wie ähnlich die beiden Proben sind.
Geführtes Sampling ist eine Technik zur Verbesserung der Stichprobenqualität in generativen Modellen mit dem Ziel, die Steuerbarkeit generativer Modelle zu verbessern.
Die oberflächliche Selbstreflexion zielt darauf ab, die Leistung der aktuellen Aufgabe oder des aktuellen Verhaltens schnell zu optimieren, indem durch sofortiges Feedback lokale Anpassungen am Modell vorgenommen werden.
Die Visualisierung multimodalen Denkens zielt darauf ab, durch die Zusammenarbeit mehrerer verschiedener Modalitäten eine intuitivere und umfassendere Darstellung von Denk-, Entscheidungs- und Informationsverarbeitungsprozessen zu ermöglichen.
Sparse Autoencoder ist ein unüberwachter Algorithmus für maschinelles Lernen.
Ziel der kontinuierlichen Konzeptmischung ist die Generierung neuer Datenproben durch die Mischung unterschiedlicher Konzepte oder Merkmale, um die Lern- und Denkfähigkeiten des Modells zu erweitern.
Ziel der deduktiven Datenbankarithmetik ist es, Daten in der Datenbank durch Inferenzregeln und mathematische Operationen abzuleiten und zu berechnen.
Methoden zur Präferenzausrichtung auf Token-Ebene zielen darauf ab, das Halluzinationsproblem in großen visuellen Sprachmodellen (LVLMs) zu reduzieren.
Die Skalierung zur Inferenzzeit ist eine Methode zur Verbesserung der Leistung großer Sprachmodelle (LLMs) durch Erhöhung der Rechenressourcen während der Inferenzphase.
Ziel der langsamen Wahrnehmung ist es, durch die Aufteilung des Wahrnehmungsprozesses eine detaillierte Wahrnehmung geometrischer Figuren zu erreichen, um so die Leistung großer multimodaler Modelle bei visuellen Denkaufgaben zu verbessern.