Harmonizer: 화이트박스 이미지 및 비디오 하모니제이션 수행 학습

최근의 이미지 조화 연구에서는 큰 오토인코더를 통해 픽셀 단위의 이미지 변환 작업으로 이 문제를 해결하고 있습니다. 그러나 고해상도 이미지를 처리할 때 이러한 방법들은 성능이 부족하고 추론 속도가 느린 문제가 있습니다. 본 연구에서는 인간이 합성된 이미지에서 실제적인 이미지를 생성하기 위해 밝기와 대비 등의 기본 이미지 필터의 입력 인자를 조정하는 것이 충분하다는 점을 관찰하였습니다. 따라서, 우리는 인간이 작업에 사용하는 필터 인자를 학습하기 위한 이미지 수준의 회귀 문제로 이미지 조화를 정의하였습니다. 우리는 이미지 조화를 위한 Harmonizer 프레임워크를 제시합니다. 기존의 블랙박스 오토인코더 기반 방법들과 달리, Harmonizer는 필터 인자 예측을 위한 신경망과 예측된 인자를 기반으로 하는 여러 개의 화이트박스 필터(필터 인자)를 포함하고 있습니다. 또한, Harmonizer가 필터 인자를 더욱 안정적이고 정확하게 학습할 수 있도록 캐스케이드 회귀기와 동적 손실 전략을 도입하였습니다. 우리의 네트워크는 오직 이미지 수준의 인자만 출력하며, 사용한 필터들이 효율적이므로 Harmonizer는 기존 방법들보다 훨씬 가볍고 빠릅니다. 포괄적인 실험 결과, 특히 고해상도 입력에서 Harmonizer가 기존 방법들을 명백히凌驾超越的事实得到了验证。最后,我们将Harmonizer应用于视频调和,实现了帧间一致的结果,并在1080P分辨率下达到了56帧每秒的速度。代码和模型可在以下网址获取: https://github.com/ZHKKKe/Harmonizer.注:最后一句中“凌驾超越”为中文词汇,可能是原文中的笔误或混入的非英文字符。根据上下文,正确的翻译应为:포괄적인 실험 결과, 특히 고해상도 입력에서 Harmonizer가 기존 방법들을 명백히 능가한다는 사실이 입증되었습니다. 마지막으로, 우리는 Harmonizer를 비디오 조화에 적용하여 프레임 간 일관된 결과와 1080P 해상도에서 56 fps의 속도를 달성하였습니다. 코드와 모델은 다음 주소에서 제공됩니다: https://github.com/ZHKKKe/Harmonizer.