HyperAIHyperAI
vor 2 Monaten

Kernmengen für Klassifizierung mit mehrkriteriellen evolutionären Algorithmen aufdecken

Pietro Barbiero; Giovanni Squillero; Alberto Tonda
Kernmengen für Klassifizierung mit mehrkriteriellen evolutionären Algorithmen aufdecken
Abstract

Ein Coreset ist eine Teilmenge des Trainingsdatensatzes, mit der ein maschinelles Lernverfahren Leistungen erzielt, die denen entsprechen, die es bei Verwendung des gesamten ursprünglichen Datensatzes liefern würde. Die Entdeckung von Coresets ist ein aktives und offenes Forschungsgebiet, da sie es ermöglicht, die Trainingsgeschwindigkeit der Algorithmen zu verbessern und möglicherweise das menschliche Verständnis für die Ergebnisse zu fördern. Aufbauend auf früheren Arbeiten wird ein neuer Ansatz vorgestellt: Kandidaten-Coresets werden iterativ optimiert, indem Stichproben hinzugefügt oder entfernt werden. Da es einen offensichtlichen Spannungsbogen zwischen der Begrenzung der Trainingsgröße und der Qualität der Ergebnisse gibt, wird ein mehrkriterieller evolutionärer Algorithmus verwendet, um gleichzeitig sowohl die Anzahl der Punkte im Satz als auch den Klassifikationsfehler zu minimieren. Experimentelle Ergebnisse an nicht trivialen Benchmarks zeigen, dass der vorgeschlagene Ansatz in der Lage ist, bessere Ergebnisse zu liefern als standesübliche Coreset-Entdeckungstechniken. Diese Ergebnisse ermöglichen einem Klassifikator, einen geringeren Fehler und eine bessere Generalisierungsfähigkeit auf unbekannten Daten zu erreichen.