HyperAI초신경

Chain-of-Zoom: 초고해상도 이미지 디테일 확대 데모

1. 튜토리얼 소개

짓다

체인 오브 줌(Chain-of-Zoom)은 KAIST AI 연구팀이 2025년 5월 26일 발표한 체인드 줌(COZ) 프레임워크입니다. 이 프레임워크는 최신 단일 이미지 초해상도(SISR) 모델이 해당 범위를 훨씬 초과하는 확대/축소를 수행할 때 실패하는 문제를 해결합니다. COZ 프레임워크에 캡슐화된 표준 4배 확산 SR 모델은 높은 지각 품질과 충실도를 유지하면서 256배 이상의 확대/축소를 달성할 수 있습니다. 관련 논문 결과는 다음과 같습니다.체인 오브 줌: 스케일 자기 회귀 및 선호도 정렬을 통한 극한 초고해상도".

이 튜토리얼에서 사용된 컴퓨팅 리소스는 듀얼 카드 RTX 4090입니다.

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

2. 사용 단계

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

구체적인 매개변수:

  • 입력 이미지: 입력 이미지.
  • 색상 정렬 방법:
    • 웨이블릿: 색상 보정이 수행되지 않습니다.
    • adain: 적응형 인스턴스 정규화를 통한 색상 보정.
    • nofix: 더욱 정교한 색상 보정을 위해 웨이블릿 변환을 사용합니다.

결과 

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

Github 사용자에게 감사드립니다 슈퍼양  이 튜토리얼의 배포. 이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@article{kim2025chain,
  title={Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment},
  author={Kim, Bryan Sangwoo and Kim, Jeongsol and Ye, Jong Chul},
  journal={arXiv preprint arXiv:2505.18600},
  year={2025}
}