Video Super-Resolution mit temporärer Gruppen-Attention

Video-Super-Resolution, das darauf abzielt, aus einer entsprechenden Niedrigauflösungs-Version eines Videos ein Hochauflösungs-Video zu erzeugen, hat in letzter Zeit zunehmend Aufmerksamkeit erhalten. In dieser Arbeit stellen wir eine neuartige Methode vor, die zeitliche Informationen hierarchisch effektiv einbezieht. Die Eingabefolge wird in mehrere Gruppen unterteilt, wobei jeder Gruppe eine bestimmte Bildwiederholungsrate zugeordnet ist. Diese Gruppen liefern ergänzende Informationen, um fehlende Details im Referenzframe wiederherzustellen, die anschließend mit einem Aufmerksamkeitsmodul und einem tiefen intra-Gruppen-Fusionsmodul integriert werden. Darüber hinaus wird ein schnelles räumliches Aligning vorgeschlagen, um Videos mit großem Bewegungsumfang zu verarbeiten. Umfangreiche Experimente belegen die Fähigkeit des vorgeschlagenen Modells, Videos mit unterschiedlichen Bewegungsmustern effektiv zu behandeln. Es erreicht gegenüber aktuellen State-of-the-Art-Methoden eine vorteilhafte Leistung auf mehreren Benchmark-Datensätzen.