Sie lernen nur eine Darstellung: Unified Network für mehrere Aufgaben

Menschen „verstehen“ die Welt über Sehen, Hören, Tasten sowie auch über vergangene Erfahrungen. Menschliche Erfahrungen können entweder durch bewusstes Lernen erworben werden (wir nennen dies explizites Wissen) oder unbewusst (wir bezeichnen dies als implizites Wissen). Diese durch normales oder unbewusstes Lernen erworbenen Erfahrungen werden im Gehirn kodiert und gespeichert. Aufgrund dieser reichen Erfahrung als umfangreiche Datenbank können Menschen Daten effektiv verarbeiten, selbst wenn sie zuvor nicht gesehen wurden. In diesem Paper stellen wir ein einheitliches Netzwerk vor, das sowohl implizites als auch explizites Wissen gleichzeitig kodiert – ähnlich wie das menschliche Gehirn Wissen sowohl aus bewusstem als auch aus unbewusstem Lernen beziehen kann. Das einheitliche Netzwerk kann eine einheitliche Darstellung erzeugen, die gleichzeitig für verschiedene Aufgaben genutzt werden kann. Innerhalb eines convolutionalen neuronalen Netzwerks können wir Kernel-Raum-Alignment, Vorhersageverfeinerung und Multi-Task-Lernen durchführen. Die Ergebnisse zeigen, dass die Einbeziehung impliziten Wissens in das neuronale Netzwerk die Leistung aller Aufgaben verbessert. Wir analysieren zudem die von dem vorgeschlagenen einheitlichen Netzwerk gelernten impliziten Darstellungen und stellen fest, dass diese eine hervorragende Fähigkeit besitzen, die physikalische Bedeutung verschiedener Aufgaben zu erfassen. Der Quellcode dieses Werkes ist verfügbar unter: https://github.com/WongKinYiu/yolor.