Command Palette
Search for a command to run...
Wiki
Machine Learning Glossary: Definitionen und Erklärungen wichtiger KI- und ML-Konzepte erkunden
Star Attention kann die Inferenzzeit erheblich verkürzen, indem es den Speicherbedarf und die Inferenzzeit um das bis zu 11-fache reduziert und gleichzeitig eine Genauigkeit von 95-100% aufrechterhält.
UniSeg3D kann 6 verschiedene 3D-Punktwolkensegmentierungsaufgaben innerhalb desselben Modells implementieren.
Das numerische Verständnis und die numerische Verarbeitung zielen darauf ab, die Leistung großer Sprachmodelle (LLMs) im numerischen Bereich unabhängig zu bewerten.
Coconut befreit den Denkprozess vom traditionellen Sprachraum und ermöglicht dem Modell, direkt im kontinuierlichen latenten Raum zu denken.
Das Dichtegesetz beschreibt, dass die Leistungsdichte großer Sprachmodelle (LLMs) mit der Zeit exponentiell zunimmt.
Bei der Suche nach dem nächsten Nachbarn handelt es sich um ein algorithmisches Problem, bei dem es darum geht, den Punkt (oder die Menge von Punkten) in einer Datenbank oder einem Datensatz zu finden, der einem gegebenen Abfragepunkt am nächsten liegt.
Unter Nachbarsuche versteht man den Vorgang der Bestimmung der Nachbarpartikel um jedes Partikel (normalerweise ein Atom) in der Simulationsbox.
Bei der Single-Point-PageRank-Berechnung wird ein Random-Walk-Modell verwendet, um die Wichtigkeit eines Knotens zu bestimmen.
Bei der verstärkten Feinabstimmung werden überwachte Feinabstimmung und bestärkendes Lernen kombiniert, um die Fähigkeit des Modells zu optimieren, qualitativ hochwertige Antworten zu generieren.
NLRL definiert die Kernkonzepte des bestärkenden Lernens in Form natürlicher Sprache neu.
MILP-StuDio zielt darauf ab, qualitativ hochwertige MILP-Instanzen zu generieren, indem die Problempartitionierungsstruktur beibehalten wird.
MILP ist eine mathematische Optimierungstechnik, die verwendet wird, um das Maximum oder Minimum einer linearen Zielfunktion zu finden, die einer Reihe linearer Einschränkungen unterliegt.
Die ereignisbasierte Kamera, auch bekannt als Dynamic Vision Sensor (DVS) oder DAVIS (Dynamic and Active-Pixel Vision Sensor), ist ein neuer Typ von visuellem Sensor, der sich von herkömmlichen Kameras unterscheidet.
Der Hauptzweck des UDK-VQA-Frameworks besteht darin, vorhandene Large Scale Vision-Language Models (LVLMs) zu verbessern, damit diese Visual Question Answering (VQA) mit modernstem Wissen handhaben können.
Das SearchLVLMs-Framework kann die Leistung von LVLMs bei der Beantwortung von Fragen, die modernstes Wissen erfordern, erheblich verbessern.
Das LLMxMapReduce-Framework durchbricht die Speicherbeschränkungen großer Modelle und erreicht theoretisch die Verarbeitungskapazität eines Kontexts „unendlicher Länge“.
AdaCache ist eine von Meta im Jahr 2024 vorgeschlagene Technologie zur Beschleunigung der KI-Videogenerierung. Sein Kern ist der adaptive Caching-Mechanismus. Die zugehörigen Ergebnisse des Papiers sind „Adaptives Caching für eine schnellere Videogenerierung mit […]
Im Jahr 2024 schlug die Carnegie Mellon University (CMU) eine neue Black-Box-Optimierungsstrategie vor, die natürliche Sprachhinweise automatisch durch ein großes Sprachmodell anpasst, um die Leistung visueller Sprachmodelle (VLMs) in mehreren nachgelagerten Aufgaben wie Textdiagrammen und visueller Erkennung zu optimieren. Dieser Ansatz erfordert nicht nur keine Berührung des Modells […]
DexMimicGen ist in der Lage, aus einer kleinen Anzahl menschlicher Demonstrationen große Mengen an Roboter-Trainingsdaten zu generieren.
MIA-DPO (Multi-Image Augmented Direct Preference Optimization) ist eine Methode zur erweiterten Präferenzausrichtung mehrerer Bilder für große visuelle Sprachmodelle (LVLMs), die gemeinsam von der Shanghai Jiao Tong University und der Shanghai Renmin University entwickelt wurde.
Das Mel-Frequenz-Cepstrum ist eine weit verbreitete Technik im Bereich der Tonverarbeitung, insbesondere bei der Spracherkennung und Sprecheridentifikation.
Der Dijkstra-Algorithmus ist ein klassischer Algorithmus zum Finden des kürzesten Pfads von einer einzelnen Quelle in einem Diagramm.
Die WISE-Technologie zielt darauf ab, Halluzinationsphänomene in großen Sprachmodellen zu bekämpfen und die Fähigkeiten des Modells zur Bearbeitung des Wissensgedächtnisses zu verbessern.
DuoAttention optimiert Speicher- und Rechenressourcen durch die Anwendung eines vollständigen KV-Cache für Abrufheader und eines leichten KV-Cache mit fester Länge für Streaming-Header.
Star Attention kann die Inferenzzeit erheblich verkürzen, indem es den Speicherbedarf und die Inferenzzeit um das bis zu 11-fache reduziert und gleichzeitig eine Genauigkeit von 95-100% aufrechterhält.
UniSeg3D kann 6 verschiedene 3D-Punktwolkensegmentierungsaufgaben innerhalb desselben Modells implementieren.
Das numerische Verständnis und die numerische Verarbeitung zielen darauf ab, die Leistung großer Sprachmodelle (LLMs) im numerischen Bereich unabhängig zu bewerten.
Coconut befreit den Denkprozess vom traditionellen Sprachraum und ermöglicht dem Modell, direkt im kontinuierlichen latenten Raum zu denken.
Das Dichtegesetz beschreibt, dass die Leistungsdichte großer Sprachmodelle (LLMs) mit der Zeit exponentiell zunimmt.
Bei der Suche nach dem nächsten Nachbarn handelt es sich um ein algorithmisches Problem, bei dem es darum geht, den Punkt (oder die Menge von Punkten) in einer Datenbank oder einem Datensatz zu finden, der einem gegebenen Abfragepunkt am nächsten liegt.
Unter Nachbarsuche versteht man den Vorgang der Bestimmung der Nachbarpartikel um jedes Partikel (normalerweise ein Atom) in der Simulationsbox.
Bei der Single-Point-PageRank-Berechnung wird ein Random-Walk-Modell verwendet, um die Wichtigkeit eines Knotens zu bestimmen.
Bei der verstärkten Feinabstimmung werden überwachte Feinabstimmung und bestärkendes Lernen kombiniert, um die Fähigkeit des Modells zu optimieren, qualitativ hochwertige Antworten zu generieren.
NLRL definiert die Kernkonzepte des bestärkenden Lernens in Form natürlicher Sprache neu.
MILP-StuDio zielt darauf ab, qualitativ hochwertige MILP-Instanzen zu generieren, indem die Problempartitionierungsstruktur beibehalten wird.
MILP ist eine mathematische Optimierungstechnik, die verwendet wird, um das Maximum oder Minimum einer linearen Zielfunktion zu finden, die einer Reihe linearer Einschränkungen unterliegt.
Die ereignisbasierte Kamera, auch bekannt als Dynamic Vision Sensor (DVS) oder DAVIS (Dynamic and Active-Pixel Vision Sensor), ist ein neuer Typ von visuellem Sensor, der sich von herkömmlichen Kameras unterscheidet.
Der Hauptzweck des UDK-VQA-Frameworks besteht darin, vorhandene Large Scale Vision-Language Models (LVLMs) zu verbessern, damit diese Visual Question Answering (VQA) mit modernstem Wissen handhaben können.
Das SearchLVLMs-Framework kann die Leistung von LVLMs bei der Beantwortung von Fragen, die modernstes Wissen erfordern, erheblich verbessern.
Das LLMxMapReduce-Framework durchbricht die Speicherbeschränkungen großer Modelle und erreicht theoretisch die Verarbeitungskapazität eines Kontexts „unendlicher Länge“.
AdaCache ist eine von Meta im Jahr 2024 vorgeschlagene Technologie zur Beschleunigung der KI-Videogenerierung. Sein Kern ist der adaptive Caching-Mechanismus. Die zugehörigen Ergebnisse des Papiers sind „Adaptives Caching für eine schnellere Videogenerierung mit […]
Im Jahr 2024 schlug die Carnegie Mellon University (CMU) eine neue Black-Box-Optimierungsstrategie vor, die natürliche Sprachhinweise automatisch durch ein großes Sprachmodell anpasst, um die Leistung visueller Sprachmodelle (VLMs) in mehreren nachgelagerten Aufgaben wie Textdiagrammen und visueller Erkennung zu optimieren. Dieser Ansatz erfordert nicht nur keine Berührung des Modells […]
DexMimicGen ist in der Lage, aus einer kleinen Anzahl menschlicher Demonstrationen große Mengen an Roboter-Trainingsdaten zu generieren.
MIA-DPO (Multi-Image Augmented Direct Preference Optimization) ist eine Methode zur erweiterten Präferenzausrichtung mehrerer Bilder für große visuelle Sprachmodelle (LVLMs), die gemeinsam von der Shanghai Jiao Tong University und der Shanghai Renmin University entwickelt wurde.
Das Mel-Frequenz-Cepstrum ist eine weit verbreitete Technik im Bereich der Tonverarbeitung, insbesondere bei der Spracherkennung und Sprecheridentifikation.
Der Dijkstra-Algorithmus ist ein klassischer Algorithmus zum Finden des kürzesten Pfads von einer einzelnen Quelle in einem Diagramm.
Die WISE-Technologie zielt darauf ab, Halluzinationsphänomene in großen Sprachmodellen zu bekämpfen und die Fähigkeiten des Modells zur Bearbeitung des Wissensgedächtnisses zu verbessern.
DuoAttention optimiert Speicher- und Rechenressourcen durch die Anwendung eines vollständigen KV-Cache für Abrufheader und eines leichten KV-Cache mit fester Länge für Streaming-Header.