Actionness-Abschätzung mit hybriden vollkonvolutiven Netzen

Actionness wurde eingeführt, um die Wahrscheinlichkeit zu quantifizieren, dass an einem bestimmten Ort eine generische Aktion vorliegt. Eine genaue und effiziente Schätzung des Actionness ist in der Videoanalyse von großer Bedeutung und kann auch andere relevante Aufgaben wie Aktionserkennung und -detektion fördern. Dieses Papier stellt eine neue tiefen Architektur zur Schätzung des Actionness vor, die als Hybrid-Fully Convolutional Network (H-FCN) bezeichnet wird. Diese besteht aus einem Appearance-FCN (A-FCN) und einem Motion-FCN (M-FCN). Beide FCNs nutzen die starke Kapazität tiefer Modelle, um Actionness-Karten aus den Perspektiven statischer Erscheinungen und dynamischer Bewegungen zu schätzen. Darüber hinaus ermöglicht die voll konvolutive Natur des H-FCN eine effiziente Verarbeitung von Videos beliebiger Größe. Experimente wurden auf den anspruchsvollen Datensätzen von Stanford40, UCF Sports und JHMDB durchgeführt, um die Effektivität des H-FCN bei der Schätzung des Actionness zu überprüfen. Diese zeigen, dass unsere Methode eine überlegene Leistung im Vergleich zu früheren Ansätzen erzielt. Zudem wenden wir die geschätzten Actionness-Karten auf die Generierung von Aktionenvorschlägen und die Aktionserkennung an. Unsere Actionness-Karten verbessern die aktuelle Standarte dieser Aufgaben erheblich.请注意,这里的“法语”应该是“德语”,在翻译要求中提到的“使其更符合法语读者的阅读习惯”应为笔误。希望这个翻译符合您的要求。