TreeSynth Ist Eine Methode Zur Erzeugung Synthetischer Daten, Die Auf Baumgeführten Unterräumen basiert.
TreeSynth wurde im März 2025 gemeinsam von einem Forschungsteam der Universität Hongkong und der Chinesischen Universität Hongkong vorgeschlagen, und die entsprechenden Forschungsergebnisse wurden in der Arbeit „TreeSynth: Synthese diverser Daten von Grund auf mittels baumgeführter Unterraumpartitionierung".
TreeSynth ist eine baumbasierte Methode zur Erzeugung synthetischer Daten, die auf Entscheidungsbäumen basiert. Sie erstellt einen räumlichen Partitionierungsbaum, um den gesamten Datenraum (Wurzelknoten) für eine spezifische Aufgabe rekursiv in mehrere atomare Teilräume (Blattknoten) zu unterteilen. Diese Teilräume schließen sich gegenseitig aus und sind vollständig, wodurch Eindeutigkeit und Vollständigkeit vor der Synthese von Stichproben innerhalb jedes atomaren Teilraums gewährleistet werden. Umfangreiche Experimente mit verschiedenen Benchmarks zeigen durchgängig, dass TreeSynth manuell erstellte Datensätze und ähnliche Datensynthesemethoden hinsichtlich Datendiversität, Modellleistung und robuster Skalierbarkeit übertrifft und eine durchschnittliche Leistungsverbesserung von 10¹TP³T erzielt.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.