Wiki
Wir haben Hunderte von verwandten Einträgen zusammengestellt, um Ihnen zu helfen, "künstliche Intelligenz" zu verstehen
Causal Attention (CATT) ist ein innovativer Aufmerksamkeitsmechanismus, der die Interpretierbarkeit und Leistung von Modellen durch die Einbeziehung kausaler Inferenz verbessert, insbesondere bei Vision-Language-Aufgaben. Dieser Mechanismus wurde 20 [...] von Forschern der Nanyang Technological University und der Monash University in Australien entdeckt.
Gedankenbäume verallgemeinern den beliebten Ansatz der Gedankenverkettung auf schnelle Sprachmodelle und ermöglichen die Erkundung zusammenhängender Texteinheiten (Gedanken) als Zwischenschritte bei der Problemlösung.
Die MoMa-Architektur ist eine neuartige, modalitätsbewusste Mischung aus Expertenarchitektur (MoE), die für das Vortraining gemischtmodaler Sprachmodelle für die frühe Fusion entwickelt wurde.
Multi-step Error Minimization (MEM) wurde 2024 vom Institute of Information Engineering der Chinesischen Akademie der Wissenschaften, der Nanyang Technological University, der National University of Singapore und der Sun Yat-sen University in der Arbeit „Multimodal Unlearnable E […]“ veröffentlicht.
Die geometrische Langlands-Vermutung ist eine geometrische Version des Langlands-Programms.
Das Langlands-Programm ist ein äußerst einflussreiches Forschungsfeld in der modernen Mathematik. Es umfasst mehrere Zweige der Mathematik, wie Zahlentheorie, algebraische Geometrie und Gruppendarstellungstheorie, und versucht, die tiefgreifenden Zusammenhänge zwischen ihnen aufzudecken.
Ein anwendungsspezifischer integrierter Schaltkreis (ASIC) ist ein integrierter Schaltkreis, der entsprechend den spezifischen Benutzeranforderungen und den Anforderungen eines bestimmten elektronischen Systems entwickelt und hergestellt wird.
Der Begriff „Wallclock Time“ wird zur Messung der Laufzeit eines Programms oder Prozesses verwendet. Es handelt sich dabei um die tatsächliche Zeit vom Beginn bis zum Ende der Programmausführung, einschließlich aller Arten von Warte- und Sperrzeiten.
Die Pareto-Front ist ein Schlüsselkonzept der Mehrzieloptimierung und bezieht sich auf eine Reihe von Lösungen, die den besten Kompromiss zwischen mehreren Zielen erzielen.
Stride ist ein Begriff, der häufig in der Bildverarbeitung und in Convolutional Neural Networks (CNN) verwendet wird. Im Kontext der Bildverarbeitung bezieht sich Schrittweite auf die Anzahl der Schritte, die das Arbeitsfenster über das Bild zurücklegt, wenn eine Operation auf das Bild angewendet wird, z. B. Zuschneiden, Merkmalsextraktion oder Filtern. Wenn Sie beispielsweise ein Bild zuschneiden, […]
Dynamic Prompts ist eine Eingabeaufforderungstechnologie, die eine dynamische Anpassung von Eingabeaufforderungen basierend auf bestimmten Aufgaben oder Instanzen in der Verarbeitung natürlicher Sprache (NLP) und anderen Anwendungen der künstlichen Intelligenz ermöglicht. Diese Technik kann die Leistung und Anpassungsfähigkeit des Modells erheblich verbessern. Dyn […]
Simple Online and Realtime Tracking (SORT) ist eine praktische Multi-Target-Tracking-Methode, die sich auf einfache und effiziente Algorithmen konzentriert. Es wurde von Forschern der Queensland University of Technology und der University of Sydney auf der IEEE International Conference on Image Processing 2016 vorgestellt. […]
Prioritized Experience Replay ist eine Methode zum bestärkenden Lernen, bei der Erfahrungen je nach Wichtigkeit in unterschiedlicher Häufigkeit wiederholt werden, wodurch die Lerneffizienz verbessert wird.
Die CoT-Technologie zerlegt komplexe Probleme in eine Reihe schrittweiser Antworten auf Teilprobleme und leitet das Modell an, einen detaillierten Denkprozess zu generieren. Dadurch wird die Leistung des Modells bei komplexen Aufgaben wie arithmetischer Argumentation, gesundem Menschenverstand und symbolischer Argumentation verbessert.
Parameter Efficient Fine-tuning (PERT) ist eine Feinabstimmungsmethode für große vortrainierte Modelle, die die Rechen- und Speicherkosten reduziert, indem nur eine kleine Teilmenge der Modellparameter feinabgestimmt wird, während gleichzeitig eine Leistung beibehalten wird, die mit der Feinabstimmung aller Parameter vergleichbar ist.
Im Bereich der künstlichen Intelligenz ist ein „Weltmodell“ ein Modell, das den Zustand der Umgebung oder der Welt charakterisieren und Übergänge zwischen Zuständen vorhersagen kann. Dieses Modell ermöglicht es dem Agenten, in einer simulierten Umgebung zu lernen und die erlernten Strategien auf die reale Welt zu übertragen, wodurch die Lerneffizienz verbessert und Risiken reduziert werden. Jürgen S […]
Multimodales kontrastives Lernen mit gemeinsamer Beispielauswahl (JEST) zielt darauf ab, das Problem des hohen Energieverbrauchs beim Training großer Sprachmodelle wie ChatGPT zu lösen.
Full Parameter Tuning ist eine Modelloptimierungstechnik im Deep Learning, die insbesondere in Transferlern- oder Domänenanpassungsszenarien verwendet wird. Dabei werden alle Parameter eines vortrainierten Modells an eine bestimmte Aufgabe oder einen bestimmten Datensatz angepasst.
Das Belegungsnetz spielt bei Wahrnehmungsaufgaben des autonomen Fahrens eine wichtige Rolle. Es handelt sich um ein Netzwerkmodell, bei dem der Schwerpunkt eher auf der Geometrie als auf der Semantik liegt. Es kann autonomen Fahrsystemen dabei helfen, freien Raum besser wahrzunehmen und ist eine Schlüsseltechnologie zur Verbesserung der Wahrnehmungsfähigkeiten und zur Bildung eines geschlossenen Kreislaufs.
Die Kernidee der Neuausrichtung während der Decodierung besteht darin, die Ausrichtung des Modells während des Decodierungsprozesses dynamisch anzupassen, ohne das Modell neu zu trainieren, wodurch Rechenressourcen gespart und die Forschungseffizienz verbessert werden.
Die dreidimensionale Gaußsche Splatter-Technologie ist eine fortschrittliche Computergrafiktechnologie, die wichtige Anwendungen bei der Punktwolkendarstellung, der Volumendatenvisualisierung und der Volumenrekonstruktion hat. Diese Technologie erzielt eine höhere Qualität der Renderings, indem sie diskrete Datenpunkte oder Voxel in eine kontinuierliche Oberflächen- oder Volumendarstellung umwandelt.
Shadow Mode Testing ist eine Testmethode, die im Bereich des autonomen Fahrens eingesetzt wird. Es wird hauptsächlich verwendet, um autonome Fahralgorithmen in realen Verkehrsumgebungen zu überprüfen und zu bewerten und gleichzeitig sicherzustellen, dass weder der Fahrer noch der umgebende Verkehr beeinträchtigt werden.
Der Fluch der Spärlichkeit ist ein zentrales wissenschaftliches Thema im Bereich des autonomen Fahrens. Es bezieht sich auf die Tatsache, dass in realen Fahrumgebungen die Wahrscheinlichkeit sicherheitskritischer Ereignisse äußerst gering ist, was dazu führt, dass diese Ereignisse in den Fahrdaten äußerst spärlich vorkommen, was es für Deep-Learning-Modelle schwierig macht, die Merkmale dieser Ereignisse zu erlernen.
Diffusionsverlust ist eine Verlustfunktion im Zusammenhang mit dem Diffusionsmodell, die während des Trainingsprozesses verwendet wird, um das Modell dabei zu unterstützen, zu lernen, wie Rauschen schrittweise entfernt und die ursprüngliche Struktur der Daten wiederhergestellt werden kann.