Command Palette
Search for a command to run...
Wiki
Machine Learning Glossary: Explore definitions and explanations of key AI and ML concepts
VLM kann durch die Ausrichtung und Verschmelzung von Bild- und Textinformationen Aufgaben des modalitätsübergreifenden Verstehens, Schlussfolgerns und Generierens bewältigen.
VLA kann Roboterbewegungen direkt auf Basis von visuellen Bildern und verbalen Befehlen generieren.
Die NSG-Statistik quantifiziert das Verhältnis des räumlichen Wahrscheinlichkeitsgradienten zur zeitlichen Dichteänderung.
Mem-I hat in mehreren Benchmark-Tests deutliche Verbesserungen gegenüber bestehenden speicheroptimierten Agenten-Baselines erzielt.
SSP demonstriert das Potenzial der Selbstspieltheorie als skalierbares und dateneffizientes Trainingsparadigma für agentenbasiertes LLM.
CudaForge ist ein einfacher, effektiver und kostengünstiger Multiagenten-Workflow zur CUDA-Kernelgenerierung und -optimierung.
FractalForensics weist eine gute Robustheit und Anfälligkeit gegenüber gängigen Bildverarbeitungsoperationen und Deepfake-Operationen auf.
ScaleNet ist ein neuartiger Ansatz, der den vortrainierten Visual Transformer (ViT) durch Gewichtsteilung erweitert.
FlashMoBA macht die theoretisch optimale Blockgröße praktisch umsetzbar und erzielt so eine bis zu 14,7-fache Beschleunigung auf GPUs.
CoT Hijacking ist eine neuartige Jailbreak-Angriffsmethode, bei der gutartige Argumentation das Ablehnungsverhalten systematisch schwächt.
InstanceAssemble ermöglicht die Erzeugung hochwertiger und kontrollierbarer Bilder unter multimodalen Bedingungen.
Layout-to-Image bietet einen flexiblen Steuerungsmechanismus für die Bildgenerierung.
HiPO wird für adaptive LLM-Inferenz verwendet, insbesondere für hybride Datenkonstruktion und hybrides Reinforcement Learning.
Als neuartiges semantikbasiertes Framework dient es der Rekonstruktion von 3D-Modellen aus wenigen Ansichten.
AEPO konzentriert sich auf das Ausbalancieren und Rationalisieren von Strategieerweiterungszweigen und Strategieaktualisierungen unter der Führung von Tool-Aufrufen mit hoher Entropie.
SDAR etabliert ein neues praktisches Sprachmodellierungsparadigma, das die sich ergänzenden Vorteile von Autoregression und Diffusion vereint.
C2C ermöglicht die direkte semantische Kommunikation durch die Transformation und Verschmelzung von Schlüssel-Wert-Caches (KV-Caches) zwischen Modellen.
CapRL kann Modelle effektiv trainieren, um allgemeinere und genauere Bildbeschreibungen zu generieren.
Das Modell approximiert die Gödel-Maschine in einer Codierungsagentenumgebung und steuert die Expansion durch Thompson-Sampling mit adaptiver Planung.
Das erste Framework, das erfolgreich die Verteilungsabgleichsdestillation auf die MDM-basierte Textgenerierung anwendet und damit einen Rekord in der Generierung von Sprachsequenzen in wenigen Schritten aufstellt.
MultiPL-MoE ist eine effektive Methode zur Erweiterung von Low-Source-Programmiersprachen in der Post-Pre-Training-Phase.
Das Team um Tongyi Qianwen untersuchte systematisch die Rolle von Gating-Mechanismen bei der Standard-Softmax-Aufmerksamkeit.
Das Lancelot-Framework integriert vollständig homomorphe Verschlüsselung in BRFL, um einen robusten Datenschutz zu erreichen.
Durch die gemeinsame Ausrichtung globaler und lokaler Merkmale können adversarieller Beispiele effektiv auf die Zielmerkmalsverteilung ausgerichtet und die Übertragbarkeit verbessert werden.
VLM kann durch die Ausrichtung und Verschmelzung von Bild- und Textinformationen Aufgaben des modalitätsübergreifenden Verstehens, Schlussfolgerns und Generierens bewältigen.
VLA kann Roboterbewegungen direkt auf Basis von visuellen Bildern und verbalen Befehlen generieren.
Die NSG-Statistik quantifiziert das Verhältnis des räumlichen Wahrscheinlichkeitsgradienten zur zeitlichen Dichteänderung.
Mem-I hat in mehreren Benchmark-Tests deutliche Verbesserungen gegenüber bestehenden speicheroptimierten Agenten-Baselines erzielt.
SSP demonstriert das Potenzial der Selbstspieltheorie als skalierbares und dateneffizientes Trainingsparadigma für agentenbasiertes LLM.
CudaForge ist ein einfacher, effektiver und kostengünstiger Multiagenten-Workflow zur CUDA-Kernelgenerierung und -optimierung.
FractalForensics weist eine gute Robustheit und Anfälligkeit gegenüber gängigen Bildverarbeitungsoperationen und Deepfake-Operationen auf.
ScaleNet ist ein neuartiger Ansatz, der den vortrainierten Visual Transformer (ViT) durch Gewichtsteilung erweitert.
FlashMoBA macht die theoretisch optimale Blockgröße praktisch umsetzbar und erzielt so eine bis zu 14,7-fache Beschleunigung auf GPUs.
CoT Hijacking ist eine neuartige Jailbreak-Angriffsmethode, bei der gutartige Argumentation das Ablehnungsverhalten systematisch schwächt.
InstanceAssemble ermöglicht die Erzeugung hochwertiger und kontrollierbarer Bilder unter multimodalen Bedingungen.
Layout-to-Image bietet einen flexiblen Steuerungsmechanismus für die Bildgenerierung.
HiPO wird für adaptive LLM-Inferenz verwendet, insbesondere für hybride Datenkonstruktion und hybrides Reinforcement Learning.
Als neuartiges semantikbasiertes Framework dient es der Rekonstruktion von 3D-Modellen aus wenigen Ansichten.
AEPO konzentriert sich auf das Ausbalancieren und Rationalisieren von Strategieerweiterungszweigen und Strategieaktualisierungen unter der Führung von Tool-Aufrufen mit hoher Entropie.
SDAR etabliert ein neues praktisches Sprachmodellierungsparadigma, das die sich ergänzenden Vorteile von Autoregression und Diffusion vereint.
C2C ermöglicht die direkte semantische Kommunikation durch die Transformation und Verschmelzung von Schlüssel-Wert-Caches (KV-Caches) zwischen Modellen.
CapRL kann Modelle effektiv trainieren, um allgemeinere und genauere Bildbeschreibungen zu generieren.
Das Modell approximiert die Gödel-Maschine in einer Codierungsagentenumgebung und steuert die Expansion durch Thompson-Sampling mit adaptiver Planung.
Das erste Framework, das erfolgreich die Verteilungsabgleichsdestillation auf die MDM-basierte Textgenerierung anwendet und damit einen Rekord in der Generierung von Sprachsequenzen in wenigen Schritten aufstellt.
MultiPL-MoE ist eine effektive Methode zur Erweiterung von Low-Source-Programmiersprachen in der Post-Pre-Training-Phase.
Das Team um Tongyi Qianwen untersuchte systematisch die Rolle von Gating-Mechanismen bei der Standard-Softmax-Aufmerksamkeit.
Das Lancelot-Framework integriert vollständig homomorphe Verschlüsselung in BRFL, um einen robusten Datenschutz zu erreichen.
Durch die gemeinsame Ausrichtung globaler und lokaler Merkmale können adversarieller Beispiele effektiv auf die Zielmerkmalsverteilung ausgerichtet und die Übertragbarkeit verbessert werden.