DreamO는 바이트댄스가 베이징대학교 선전대학원 전자컴퓨터공학과와 협력하여 2025년 5월 12일에 출시한 통합 이미지 커스터마이징 프레임워크입니다. DiT(Diffusion Transformer) 아키텍처를 기반으로 하는 이 프로젝트는 문자 교체(IP), 얼굴 교체(ID), 스타일 전송, 다중 피사체 조합과 같은 복잡한 기능을 지원하며, 단일 모델을 통해 다양한 조건 제어를 구현하는 등 다양한 이미지 생성 작업을 통합합니다. 관련 연구 논문은 여기에서 확인할 수 있습니다. DreamO: 이미지 사용자 정의를 위한 통합 프레임워크 .
이 튜토리얼에서는 단일 카드 A6000에 대한 리소스를 사용합니다.
2. 프로젝트 예시
3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 1~2분 정도 기다리신 후 페이지를 새로고침해 주세요.
2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.
매개변수 설명:
일:
아이피: 입력 이미지의 배경을 자동으로 제거하고 객체/캐릭터의 주요 내용을 유지합니다. 의류나 물건 등의 장면에 적합합니다.
ID: 얼굴 특징 영역을 정확하게 추출하고 신원 특징 마이그레이션을 지원합니다. 최적화된 얼굴 인식 알고리즘을 기반으로 다양한 각도와 조명 조건의 인물 사진에 적응할 수 있습니다.
스타일: 프롬프트 단어 앞에 "동일한 스타일의 이미지 생성" 명령을 추가해야 합니다. 시스템은 원래의 배경과 시각적 스타일을 그대로 이어받아 구성 요소의 창의적인 확장을 실현합니다.
너비: 생성된 이미지의 너비를 제어하는 데 사용됩니다.
키: 생성된 이미지의 높이를 제어하는 데 사용됩니다.
안내: 생성 모델에서 조건부 입력(예: 텍스트나 이미지)이 생성된 결과에 미치는 영향의 정도를 제어하는 데 사용됩니다. 높은 지침 값을 사용하면 생성된 결과가 입력 조건과 더 일치하게 되지만, 낮은 값을 사용하면 더 많은 무작위성이 유지됩니다.
단계 수: 모델의 반복 횟수 또는 추론 과정의 단계 수를 나타내며, 모델이 결과를 생성하는 데 사용하는 최적화 단계 수를 나타냅니다. 일반적으로 단계 수가 많을수록 더 정교한 결과가 나오지만 계산 시간은 늘어날 수 있습니다.
씨앗: 생성 과정의 무작위성을 제어하는 데 사용되는 난수 시드입니다. 동일한 Seed 값은 동일한 결과를 생성할 수 있습니다(다른 매개변수가 동일하다는 전제 하에). 이는 결과를 재현하는 데 매우 중요합니다.
사용 방법
4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓
이 노트북은 커뮤니티 사용자가 기여한 것으로 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.
AI로 AI 구축
아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.
DreamO는 바이트댄스가 베이징대학교 선전대학원 전자컴퓨터공학과와 협력하여 2025년 5월 12일에 출시한 통합 이미지 커스터마이징 프레임워크입니다. DiT(Diffusion Transformer) 아키텍처를 기반으로 하는 이 프로젝트는 문자 교체(IP), 얼굴 교체(ID), 스타일 전송, 다중 피사체 조합과 같은 복잡한 기능을 지원하며, 단일 모델을 통해 다양한 조건 제어를 구현하는 등 다양한 이미지 생성 작업을 통합합니다. 관련 연구 논문은 여기에서 확인할 수 있습니다. DreamO: 이미지 사용자 정의를 위한 통합 프레임워크 .
이 튜토리얼에서는 단일 카드 A6000에 대한 리소스를 사용합니다.
2. 프로젝트 예시
3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 1~2분 정도 기다리신 후 페이지를 새로고침해 주세요.
2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.
매개변수 설명:
일:
아이피: 입력 이미지의 배경을 자동으로 제거하고 객체/캐릭터의 주요 내용을 유지합니다. 의류나 물건 등의 장면에 적합합니다.
ID: 얼굴 특징 영역을 정확하게 추출하고 신원 특징 마이그레이션을 지원합니다. 최적화된 얼굴 인식 알고리즘을 기반으로 다양한 각도와 조명 조건의 인물 사진에 적응할 수 있습니다.
스타일: 프롬프트 단어 앞에 "동일한 스타일의 이미지 생성" 명령을 추가해야 합니다. 시스템은 원래의 배경과 시각적 스타일을 그대로 이어받아 구성 요소의 창의적인 확장을 실현합니다.
너비: 생성된 이미지의 너비를 제어하는 데 사용됩니다.
키: 생성된 이미지의 높이를 제어하는 데 사용됩니다.
안내: 생성 모델에서 조건부 입력(예: 텍스트나 이미지)이 생성된 결과에 미치는 영향의 정도를 제어하는 데 사용됩니다. 높은 지침 값을 사용하면 생성된 결과가 입력 조건과 더 일치하게 되지만, 낮은 값을 사용하면 더 많은 무작위성이 유지됩니다.
단계 수: 모델의 반복 횟수 또는 추론 과정의 단계 수를 나타내며, 모델이 결과를 생성하는 데 사용하는 최적화 단계 수를 나타냅니다. 일반적으로 단계 수가 많을수록 더 정교한 결과가 나오지만 계산 시간은 늘어날 수 있습니다.
씨앗: 생성 과정의 무작위성을 제어하는 데 사용되는 난수 시드입니다. 동일한 Seed 값은 동일한 결과를 생성할 수 있습니다(다른 매개변수가 동일하다는 전제 하에). 이는 결과를 재현하는 데 매우 중요합니다.
사용 방법
4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓
이 노트북은 커뮤니티 사용자가 기여한 것으로 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.
AI로 AI 구축
아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.