온라인 튜토리얼 | 싱가포르 국립대학교 Show Lab에서 플러그 앤 플레이 이미지 스타일 전송을 구현하기 위한 OmniConsistency 모델 출시

特色图像

이미지 스타일화는 스타일화된 모델을 통해 의미적 내용은 그대로 유지하면서 이미지를 한 스타일에서 다른 스타일로 변환하는 것을 목표로 합니다. 최근 확산 모델의 등장으로 주요 이미지 스타일화 방식은 심층 신경망에서 저랭크 적응(LoRA)을 통해 미세 조정된 방식으로 전환되었으며, 이미지 일관성 모듈과 결합되면서 스타일화 품질이 크게 향상되었습니다.

이미지 스타일링 모델은 시장에서 좋은 평가를 받았지만,그러나 현재의 이미지 스타일링 방법은 여전히 세 가지 주요 과제에 직면해 있습니다.첫째, 양식화된 출력과 입력 간의 일관성이 제한적입니다. 기존 모듈은 전반적인 구조적 정렬을 보장할 수 있지만 복잡한 장면에서 세부 정보와 의미 정보를 유지하는 데 어려움이 있습니다. 둘째, 이미지 대 이미지 시나리오에서 스타일 저하 문제가 있습니다. 이 설정에서 LoRA와 IPAdapter의 스타일 충실도는 일반적으로 텍스트로 생성된 이미지보다 낮습니다. 셋째, 레이아웃 제어가 충분히 유연하지 않습니다. 엄격한 조건(예: 모서리, 스케치, 자세)에 의존하는 방법은 Q 버전 변환과 같은 창의적인 구조적 변경을 지원하기 어렵습니다.

이러한 격차를 해소하기 위해2025년 5월 28일, 싱가포르 국립대학교의 Show Lab은 대량 확산 Transformer(DiT)를 사용하는 범용 일관성 플러그인인 OmniConsistency를 출시했습니다.Flux 프레임워크 하의 모든 스타일의 LoRA와 호환되는 완벽한 플러그 앤 플레이 디자인이며, 견고한 일반화를 달성하기 위해 양식화된 이미지 쌍의 일관성 학습 메커니즘을 기반으로 합니다.

실험 결과, OmniConsistency는 시각적 일관성과 미적 품질을 크게 개선하는 것으로 나타났습니다.GPT-4o와 비슷한 성능을 달성하여 스타일 일관성 측면에서 오픈 소스 모델과 상용 모델 간의 성능 격차를 메웁니다.AI 개발을 위한 저렴하면서도 제어 가능성이 뛰어난 솔루션을 제공합니다. 또한, 호환성과 플러그 앤 플레이 기능을 통해 개발자와 제작자의 사용 문턱을 낮춰줍니다.

현재,HyperAI 공식 웹사이트의 "튜토리얼" 섹션에서 "OmniConsistency: GPT-4o 수준 문자 스타일 전송 모델"이 출시되었습니다.아래 링크를 클릭하여 원클릭 배포 튜토리얼을 경험해보세요 ⬇️

* 튜토리얼 주소:https://go.hyper.ai/3mCyv

신규 가입 사용자를 위한 깜짝 혜택도 준비했습니다. 초대 코드 "OmniConsistency"를 사용하여 OpenBayes 플랫폼에 가입하시면 RTX A6000을 4시간 동안 무료로 사용하실 수 있습니다(1개월 동안 유효). 수량이 한정되어 있어 선착순으로 제공됩니다!

데모 실행

1. hyper.ai 홈페이지에 접속한 후, "튜토리얼" 페이지를 선택하고, "OmniConsistency: GPT-4o 수준 문자 스타일 전송 모델"을 선택한 후, "이 튜토리얼을 온라인으로 실행"을 클릭합니다.

2. 페이지가 이동한 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.

3. "NVIDIA RTX A6000 48GB" 및 "PyTorch" 이미지를 선택하세요. OpenBayes 플랫폼은 4가지 결제 방식을 제공합니다. 필요에 따라 "종량제" 또는 "일일/주간/월간"을 선택할 수 있습니다. "계속"을 클릭하세요. 신규 사용자는 아래 초대 링크를 통해 등록하시면 RTX 4090 4시간 + CPU 무료 사용 시간 5시간을 받으실 수 있습니다!

HyperAI 독점 초대 링크(복사하여 브라우저에서 열기):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. 리소스가 할당될 때까지 기다리세요. 첫 번째 클로닝 과정은 약 2분이 걸립니다. 상태가 "실행 중"으로 변경되면 "API 주소" 옆에 있는 점프 화살표를 클릭하여 데모 페이지로 이동합니다. 모델이 크기 때문에 WebUI 인터페이스를 표시하는 데 약 3분이 걸리며, 그렇지 않으면 "잘못된 게이트웨이"가 표시됩니다. API 주소 접근 기능을 이용하기 위해서는 이용자가 실명인증을 완료해야 합니다.

효과 시연

인물 사진을 업로드했는데, "내장 LoRA 선택" 매개변수가 LEGO입니다. 효과는 아래 그림과 같습니다~