최근 몇 년간 깊은 학습 기법은 압축 영상의 품질 향상 분야에서 놀라운 성과를 거두었다. 시간 정보를 더 효과적으로 탐색하기 위해 기존의 방법들은 일반적으로 시간적 운동 보정을 위해 광학 흐름(optical flow)을 추정한다. 그러나 압축 영상은 다양한 압축 아티팩트로 인해 심각한 왜곡을 겪을 수 있기 때문에, 추정된 광학 흐름은 정확도가 낮고 신뢰할 수 없게 되어 결과적으로 품질 향상 효과가 제한된다. 더불어, 연속 프레임 간의 광학 흐름 추정은 일반적으로 쌍별(pairwise)로 수행되며, 이는 계산 비용이 높고 효율성이 낮은 문제를 야기한다. 본 논문에서는 새로운 시공간 변형 융합(Spatio-Temporal Deformable Fusion, STDF) 구조를 도입하여 시간 정보를 효율적으로 통합함으로써, 압축 영상의 품질 향상을 위한 빠르고 효과적인 방법을 제안한다. 구체적으로, 제안하는 STDF는 대상 프레임과 그 인접한 참조 프레임을 입력으로 받아, 복합 연산의 공간-시간 샘플링 위치를 변형하기 위한 오프셋 필드(offset field)를 동시에 예측한다. 이를 통해 대상 프레임과 참조 프레임의 보완적 정보를 단일한 시공간 변형 합성(convolution, Spatio-Temporal Deformable Convolution, STDC) 연산 내에서 융합할 수 있다. 광범위한 실험 결과는 제안한 방법이 정확성과 효율성 측면에서 압축 영상 품질 향상 분야에서 최신 기술 수준(SOTA)의 성능을 달성함을 보여준다.