온라인 튜토리얼 | 튜링상 수상자 얀 르쿤이 칭찬을 받았습니다! Xiaohongshu는 InstantID 소스를 공개하여 사용자가 단 하나의 원본 사진으로 다양한 스타일로 사진을 사용자 정의할 수 있도록 했습니다.

얼마 전, 샤오홍수의 95년 이후 엔지니어 그룹과 베이징 대학의 팀이 공동으로 오픈소스 프로젝트인 "InstantID"를 출시했습니다.사진을 업로드하기만 하면, 이 AI 사진 도구가 다양한 스타일로 AI 사진을 쉽게 사용자 지정할 수 있어 지루한 사진 편집과 작별할 수 있습니다.
InstantID가 출시되자마자 폭넓은 관심을 끌었으며, GitHub에 9,900개의 컬렉션이 등록되었습니다. 튜링상 수상자인 얀 르쿤도 자신의 소셜 계정에 해당 팀이 생성한 예시 이미지를 다시 게시하여 지지를 표명했습니다.

과거에는 주제 중심의 텍스트-이미지 생성에는 일반적으로 주제가 포함된 여러 데이터 세트(사람, 스타일 등)에 대한 학습이 필요했습니다. 대표적인 솔루션으로는 DreamBooth와 LoRA가 있습니다. 그러나 이러한 솔루션은 저장 공간이 많이 필요하고 미세 조정 과정에 시간이 많이 걸리기 때문에 많은 사용자가 이를 포기했고, 실제 상황에 신속하게 적용할 수 없었습니다. InstantID의 등장으로 이런 교착 상태가 깨졌습니다.

InstantID의 작동 원리는 주로 세 부분으로 나뉩니다.
* ID 임베딩: 사전 학습된 얼굴 인식 모델을 통해 의미적 얼굴 특징을 추출하여 얼굴 임베딩에 적용합니다. 이러한 임베딩은 얼굴 특징, 표정, 나이 등과 같은 의미적 정보가 풍부하여 이후 이미지 생성을 위한 견고한 기반을 제공합니다.
* 이미지 어댑터: 추출된 ID 정보를 텍스트 프롬프트와 결합하기 위해 가벼운 적응 모듈이 도입되었습니다. 분리된 교차 주의 메커니즘을 통해 이미지와 텍스트는 이미지 생성에 독립적으로 영향을 미치는 동시에, 신원 정보를 유지하고 이미지 스타일을 정밀하게 제어할 수 있습니다.
* 아이덴티티넷: 강한 의미적 조건(얼굴 특징에 대한 자세한 설명 등)과 약한 공간적 조건(얼굴 랜드마크의 위치 등)을 통해 참조 얼굴 이미지의 복잡한 특징을 인코딩합니다. 생성 과정은 얼굴 임베딩을 통해 이루어지며 텍스트 정보가 필요하지 않습니다. 새로 추가된 모듈에 대해서만 업데이트하면 되고, 유연성을 보장하기 위해 사전 훈련된 텍스트-이미지 모델을 고정해 두면 됩니다.
복잡성은 코드에 맡기고 단순성은 사용자에게 맡기세요!InstantID는 제로타임 개인화 이미지 합성 분야에서 기술적 혁신을 이룰 뿐만 아니라, 사용자 경험 측면에서도 극도의 단순성과 직관성을 구현했습니다. 디자인 초보자든 미술 전문가든 이 플랫폼에서 쉽게 개인화된 이미지를 만들 수 있습니다. 구체적인 적용 시나리오는 다음과 같습니다.
* 다중 ID 및 다중 스타일 합성
InstantID를 사용하면 한 번의 클릭으로 "국경 간 협력"이 가능합니다!

* 양식화된 합성
얼굴 사진만 입력하면 개인화된 스타일의 다양한 AI 사진을 생성해줍니다.

* 사실적인 합성
이 이미지들은 정말 합성된 것인가요?

* ID 보간
양미와 테일러의 이미지를 합치는 것도 가능합니다. (ps: 이 기능을 이용하면 부모의 얼굴 무게를 기반으로 자녀의 미래 모습을 예측할 수도 있습니다!)

* 새로운 관점의 합성
원본 사진 1장 + 스타일 참조 사진 1장 = 다재다능한 유명인

* 비인물 합성
사람과 동물이 합쳐지면 무슨 일이 일어날까?

선택할 수 있는 스타일이 너무 많아서, 꼭 한 번 시도해보고 싶지 않으세요? 괜찮아요,HyperAI는 "InstantID 개인화 사진 생성 데모" 튜토리얼을 출시했습니다.이 튜토리얼은 당신을 위한 환경을 구축했습니다. 복제를 클릭하면 클릭 한 번으로 시작할 수 있습니다. 와서 당신의 "72가지 변신"을 실현해보세요!
공개 튜토리얼 주소:
https://hyper.ai/tutorials/31559
데모 실행
1. hyper.ai에 로그인하고 튜토리얼 페이지에서 InstantID 개인화 사진 생성 데모를 선택합니다. 이 튜토리얼을 온라인으로 실행해보세요.

2. 페이지가 이동한 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다. 오른쪽 하단에 있는 "다음: 해시레이트 선택"을 클릭합니다.


3. 이동 후 "NVIDIA GeForce RTX 4090"을 선택하고 "다음: 검토"를 클릭합니다.신규 사용자는 아래 초대 링크를 사용하여 등록하여 RTX 4090 4시간 + 5시간을 받을 수 있습니다. CPU 무료해시레이트지속!
HyperAI 독점 초대 링크(복사하여 브라우저에서 열기):https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej

4. "계속 실행"을 클릭하고 리소스가 할당될 때까지 기다립니다. 상태가 "실행 중"으로 변경되면 "작업 공간 열기"를 클릭합니다.


5. 시작 페이지에서 새 터미널 세션을 만들고 다음 명령을 입력합니다.
cd InstantID


6. Gradio 데모를 실행하려면 다음 명령을 입력하세요.
python gradio_demo/app.py

7. 명령줄에 "로컬 URL에서 실행 중: https://0.0.0.0:8080"이 표시되면 오른쪽에 있는 API 주소를 브라우저 주소창에 복사하여 InstantID 페이지에 액세스하세요.API 주소 접근 기능을 이용하기 위해서는 이용자는 실명인증을 완료해야 합니다.



효과 표시
1. InstantID 페이지를 열고 캐릭터 이미지를 업로드하고, 참조 이미지를 업로드하세요. 이 중 참조 그림의 역할은 그림 속 인물의 위치를 고정하는 것입니다.

2. 다음 매개변수 조정을 개선하세요.
*"프롬프트" 상자에 생성하려는 이미지에 대한 키워드를 적어주세요. 일반적으로 프롬프트는 초기 이미지를 기반으로 합니다. 업로드한 이미지가 남자일 경우, "a man"이라고 쓸 수 있습니다.
*"LCM으로 빠른 추론 활성화" 옵션을 클릭하세요. 켜지지 않으면 이미지 생성 속도가 약간 느려집니다.

*「스타일 템플릿」스타일 선택기를 사용하면 「수채화」, 「선화」 등의 효과를 포함하여 프롬프트 단어를 개선할 수 있습니다.
*「IdentityNet 강도(충실도용)」얼굴 강도 또는 ID 강도는 처음에 가져온 문자 이미지에 적용됩니다. 매개변수가 높을수록 생성된 이미지가 캐릭터 이미지와 유사해집니다. 기본값은 0.8입니다.
*「이미지 어댑터 강도(세부 정보용)」이미지 참조 강도는 참조 이미지에 작용하며, 이 강도는 생성된 이미지와 참조 이미지 간의 유사도를 결정합니다. 기본값은 0.8입니다.

*「고급 옵션」고급 매개변수 조정.
*「부정적 프롬프트」, 부정적인 프롬프트 단어. 품질이 낮은 단어 등을 피하는 등 최종적으로 생성되는 이미지에 포함되기를 원하지 않는 내용을 입력할 수 있습니다.
* "샘플 단계 수", "지침 척도" 및 "시드"는 기본값을 선택하기만 하면 됩니다.
*「시드 무작위화」무작위 시드, 켜기.
*「비얼굴 부위 강화」는 비얼굴 부위를 강화합니다. 이 기능을 켜면 스타일 선택기의 가중치가 증가합니다.

3. "제출"을 클릭하면 5초 후에 이미지가 생성됩니다.


현재 HyperAI 공식 웹사이트에서는 Jupyter Notebook 형태로 구성된 수백 개의 선택된 머신 러닝 관련 튜토리얼을 출시했습니다.
관련 튜토리얼과 데이터 세트를 검색하려면 링크를 클릭하세요.https://hyper.ai/tutorials
위에 적힌 내용이 이번에 HyperAI Super Neural Network가 공유한 내용의 전부입니다. 고품질 프로젝트를 발견하시면, 배경에 메시지를 남겨서 저희에게 추천해 주세요! 또한, 우리는 "안정 확산 튜토리얼 교환 그룹"도 설립했습니다. 다양한 기술적인 문제를 논의하고 신청 결과를 공유하기 위해 그룹에 가입해 주세요~
QR 코드를 스캔하여 튜토리얼 교환 그룹에 참여하세요

그룹에 가입하기 위한 QR 코드가 유효하지 않은 경우, 아래의 QR 코드를 스캔하여 Neuro Star(WeChat ID: Hyperai01)의 WeChat 계정을 추가하고 "SD 튜토리얼 교환 그룹"이라고 메모한 후 그룹 채팅에 가입할 수 있습니다.
