11일 전

간단한 확산: 고해상도 이미지에 대한 엔드투엔드 확산

Emiel Hoogeboom, Jonathan Heek, Tim Salimans
간단한 확산: 고해상도 이미지에 대한 엔드투엔드 확산
초록

현재 고해상도 이미지의 픽셀 공간에서 확산 모델을 적용하는 것은 어려운 과제이다. 대신 기존의 접근 방식들은 낮은 차원의 공간(잠재 확산, latent diffusion)에서의 확산에 초점을 맞추거나, 여러 단계의 초해상도 생성을 포함하는 캐스케이드 구조를 사용한다. 그러나 이러한 방법들은 확산 프레임워크에 추가적인 복잡성을 도입한다는 단점이 있다.본 논문은 고해상도 이미지에 대한 노이즈 제거 확산 모델을 개선하면서도 모델 구조를 가능한 한 단순하게 유지하는 것을 목표로 한다. 이 논문의 핵심 연구 질문은 다음과 같다: 고해상도 이미지에서 표준 노이즈 제거 확산 모델을 어떻게 훈련시킬 수 있으며, 그 성능을 대체적 접근 방식과 비슷하게 유지할 수 있는가?본 연구에서 도출된 주요 네 가지 발견은 다음과 같다. 첫째, 고해상도 이미지에 맞게 노이즈 스케줄을 조정해야 한다. 둘째, 아키텍처의 특정 부분만 확장하면 충분하다. 셋째, 아키텍처 내 특정 위치에 드롭아웃을 추가하는 것이 효과적이다. 넷째, 다운샘플링은 고해상도 특징 맵을 피하는 효과적인 전략이다. 이러한 단순하면서도 효과적인 기법들을 결합함으로써, ImageNet 데이터셋에서 샘플링 수정기법 없이도 기존 확산 모델 중 최고 수준의 이미지 생성 성능을 달성하였다.

간단한 확산: 고해상도 이미지에 대한 엔드투엔드 확산 | 최신 연구 논문 | HyperAI초신경