HyperAI초신경

사나 고해상도 이미지 합성

GitHub-Sana
별
arXiv-논문
특허

1. 튜토리얼 소개

사나는 2025년 1월에 출시되었으며 NVIDIA, MIT, 청화대학교가 공동으로 주도하고 있습니다. Sana는 최대 4096×4096 해상도의 이미지를 효율적으로 생성할 수 있는 텍스트-이미지 프레임워크입니다. 사나는 강력한 텍스트-이미지 정렬 기능을 갖추고 있어 매우 빠른 속도로 고해상도, 고품질 이미지를 합성할 수 있습니다. 관련 논문 결과는 다음과 같습니다.SANA: 선형 확산 변압기를 사용한 효율적인 고해상도 이미지 합성"는 ICLR 2025에 승인되었습니다.

이 튜토리얼에서는 데모를 위해 Sana_1600M_1024px 모델을 사용하고, 컴퓨팅 리소스에는 단일 4090 카드가 사용됩니다.

2. 작업 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 약 1~2분 정도 기다려 주신 후 페이지를 새로고침해 주세요.

2. 데모 사용

인용 정보

Github 사용자에게 감사드립니다 슈퍼양  이 튜토리얼을 배포하기 위한 프로젝트 참조 정보는 다음과 같습니다.

@misc{Sana2025,
  title={Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer},
  author={Enze Xie, Junsong Chen, Junyu Chen, Han Cai, Haotian Tang, Yujun Lin, Zhekai Zhang, Muyang Li, Ligeng Zhu, Yao Lu, Song Han},
  howpublished={\url{https://nvlabs.github.io/Sana/}},
  note={GitHub Repository with Code, Model & Documentation},
  year={2025}
}

논의

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓