PhotoMaker V2는 몇 초 만에 개인화된 사진을 생성합니다. 데모
PhotoMaker V2: V1에 비해 향상된 ID 충실도 및 더 큰 제어력

튜토리얼 소개
PhotoMaker는 Tencent 팀이 2024년에 오픈 소스로 공개한 효율적인 인물 사진 맞춤형 그래픽 모델입니다. 인물 사진을 기반으로 맞춤형 예술적 스타일의 사진을 빠르게 생성할 수 있습니다. 개인화된 초상화를 생성하는 것 외에도 캐릭터의 나이와 성별을 변경하고, 다양한 캐릭터의 특성을 통합하여 새로운 캐릭터 정보를 만들 수도 있습니다. 매우 실용적인 AI 페인팅 도구입니다. 이 튜토리얼은 PhotoMaker 2.0 버전으로, V1에 비해 캐릭터의 일관성과 제어성이 크게 향상되었습니다.
이 튜토리얼에서는 관련 환경이 이미 설정되어 있습니다. 데모를 경험하려면 명령어만 입력하면 됩니다.


PhotoMaker V2의 주요 개선 사항
- 특히 단일 이미지 입력과 아시아인 얼굴 입력의 경우 ID 충실도가 더욱 향상되었습니다. 더 많은 얼굴 이미지를 입력해도 더 나은 결과를 얻을 수 있습니다.
- ControlNet, twi-adapter, IP-Adapter를 통합함으로써 생성 프로세스를 보다 제어하기 쉬워졌습니다. 연구팀은 참고를 위해 해당 스크립트를 제공했습니다. 또한 PhotoMaker V2를 사용하면 IP-Adapter-FaceID, InstantID 및 Character LoRA와 결합하여 더 나은 ID 일관성을 달성할 수 있습니다.
- PhotoMaker V2는 PhotoMaker V1의 뛰어난 기능, 즉 고품질, 다양한 생성 기능, 강력한 텍스트 제어 기능을 그대로 이어받았습니다. 또한, 오래된 사진이나 그림 속 인물을 현실로 복원하거나, 정체성 혼합, 나이 또는 성별 변경 등 이전 모델을 통합할 수도 있습니다.
효과 표시

실행 방법
1. 컨테이너를 복제하고 시작한 후 작업 공간을 엽니다.

2. 새 터미널을 생성하고 명령을 입력하세요. bash run.sh


3. 포트 8080이 나타나면 오른쪽 API 주소의 링크를 클릭하여 모델 경험에 진입합니다.

4. 웹사이트에 접속하면 다음과 같은 인터페이스를 보실 수 있습니다.

- 사용하고 싶은 인물사진을 업로드하세요(여러장의 사진을 업로드할 수 있습니다)
- 영어 입력 프롬프트를 사용하면 모델은 입력 프롬프트를 기반으로 이미지를 생성합니다.
생성될 카테고리 어휘는 반드시 트리거 단어인 img를 사용해야 합니다(예: man img, woman img, girl img).
- 스타일 템플릿에서 원하는 스타일을 선택하세요. 이러한 스타일은 일부 사전 설정된 프롬프트입니다.
- 제출을 클릭하면 이미지가 생성됩니다.
웹사이트 하단에 몇 가지 예가 있습니다. 클릭하면 바로 로드됩니다.

귀하의 요구 사항에 맞게 고급 설정을 변경할 수도 있습니다. 다음은 몇 가지 매개변수 설명입니다.

- 부정적 프롬프트: 이는 출력을 생성할 때 피해야 할 기능을 지정합니다. "대칭성이 낮음, 품질이 좋지 않음, 저품질, 일러스트레이션, 3D, 2D, 그림, 만화, 스케치, 벌린 입"과 같은 용어를 입력하면 모델은 생성된 이미지에 이러한 특징이 포함되지 않도록 합니다.
- 샘플 단계 수: 이는 모델이 이미지를 생성할 때 취하는 단계 수를 제어합니다. 일반적으로 단계가 많을수록 모델이 출력을 세부적으로 조정할 수 있는 기회가 더 많아지므로 이미지 품질이 더 높아집니다.
- 스타일 강도: 이는 지정된 스타일이 출력 이미지에 얼마나 영향을 미치는지 나타냅니다. 백분율이 높을수록 스타일의 영향력이 커집니다.
- 출력 이미지 수: 이는 모델이 한 번의 생성 프로세스에서 생성해야 하는 이미지 수를 결정합니다.
- 지침 척도: 이 매개변수는 모델이 프롬프트를 얼마나 엄격하게 따라야 하는지 조정합니다. 안내 비율이 높을수록 모델이 프롬프트를 더 밀접하게 따르므로, 더 정확하지만 덜 창의적인 결과가 나올 수 있습니다.
- 시드: 시드 값은 난수 생성기를 초기화하고 출력에 영향을 미치는 데 사용됩니다. 특정 시드를 설정하면 재현 가능한 결과를 보장할 수 있습니다. 무작위 시드를 체크하면 매번 다른 이미지가 생성됩니다.
토론 및 교류
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔 및 [튜토리얼 교환]에 댓글을 남겨 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓
