HyperAIHyperAI
vor 17 Tagen

Effizientes adaptives Ensembling für die Bildklassifikation

Antonio Bruno, Davide Moroni, Massimo Martinelli
Effizientes adaptives Ensembling für die Bildklassifikation
Abstract

In jüngster Zeit zeigt die Computer Vision-Forschung, abgesehen von gelegentlichen Ausnahmen, einen Trend hin zu geringfügigen Verbesserungen bei deutlich steigender Komplexität. Um diesen Trend umzukehren, schlagen wir eine neuartige Methode vor, die die Leistungsfähigkeit bei der Bildklassifikation steigert, ohne die Komplexität zu erhöhen. Dazu überprüften wir erneut das Ensembling, eine leistungsstarke Technik, die aufgrund ihrer höheren Komplexität und der längeren Trainingszeiten oft nicht optimal genutzt wird. Durch eine spezifische Gestaltungslösung machen wir sie nun praktikabel. Zunächst trainierten wir zwei EfficientNet-b0-Modelle end-to-end auf disjunkten Datensätzen (d. h. Bagging). Anschließend erzielten wir eine effiziente adaptive Ensembles durch Feinabstimmung einer lernbaren Kombinationsschicht. Auf diese Weise konnten wir die State-of-the-Art-Leistung im Durchschnitt um 0,5 % bei der Genauigkeit übertreffen, wobei sowohl die Anzahl der Parameter (um das 5- bis 60-fache reduziert) als auch die FLOPS (Fließkommaoperationen pro Sekunde, um das 10- bis 100-fache reduziert) auf mehreren bedeutenden Benchmark-Datensätzen deutlich eingeschränkt blieben.