온라인 튜토리얼: Qwen-Image, 이미지 편집의 새로운 지평을 열다, 정확한 중국어 렌더링 구현

特色图像

최근에,알리 통이 첸웬 팀은 최초의 기본 이미지 생성 모델인 Qwen-Image를 오픈 소스로 공개했습니다.매개변수의 수는 20B에 달하고, 새로운 MMDiT 아키텍처를 채택하여 이미지 생성 모델의 SOTA를 새롭게 했습니다.

Qwen-Image는 복잡한 텍스트 렌더링과 정밀한 이미지 편집이라는 두 가지 핵심 시나리오에서 AI 역량을 개선하는 데 중점을 둡니다.포스터의 슬로건, PPT의 긴 문단, 고서의 시적인 분위기 등 어떤 표현이든 Qwen-Image는 뛰어난 글꼴 모양, 조판, 의미 체계를 갖춘 뛰어난 렌더링 기능을 통해 중국어와 영어로 정확하게 표현할 수 있습니다. 여러 평가 목록에서 텍스트 렌더링은 SOTA 인증을 받았습니다. 특히 Qwen-Image의 강력한 중국어 렌더링 성능은 오픈 소스 시각 모델의 중국어 기능 구축을 강력하게 보완하여 중국어가 시각 모델 렌더링 시스템에 더욱 자연스럽게 통합될 수 있도록 지원합니다.단일 단어 렌더링의 정확도는 58.3%에 달해 정확한 중국어 출력이 필요한 애플리케이션 시나리오에서 신뢰할 수 있는 선택이 될 수 있습니다.

이미지 편집 측면에서 Qwen-Image는 강력한 다차원 기능을 제공합니다.스타일 전송, 추가, 삭제, 수정 등의 기본적인 작업은 물론, 로컬 수정, 캐릭터 자세 조정 등의 세부적인 기능도 지원합니다.Qwen-Image를 사용하면 일반 사용자도 전문가 수준의 이미지 편집 결과를 쉽게 얻을 수 있습니다. 체인 편집은 강력한 "메모리 앵커링" 기능을 통해 모델에 여러 차례 수정 후에도 피사체 ID의 일관성을 유지하여 "수정 후 수정, 수정 후 수정"의 번거로움을 해소합니다.

Qwen-Image: 고급 텍스트 렌더링 기능을 갖춘 이미지 모델HyperAI 공식 웹사이트(hyper.ai)의 "튜토리얼" 섹션에서 지금 바로 만나보세요. 지금 바로 배포하고 전문가 수준의 결과물을 손쉽게 얻어보세요!

튜토리얼 링크:

https://go.hyper.ai/jmfJQ

데모 실행

1. hyper.ai 홈페이지에서 '튜토리얼' 페이지를 선택하고 'Qwen-Image: 고급 텍스트 렌더링을 갖춘 이미지 모델'을 선택한 후 '이 튜토리얼을 온라인으로 실행'을 클릭합니다.

2. 페이지가 이동한 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.

3. NVIDIA RTX A6000 48GB 및 PyTorch 이미지를 선택하고, 필요에 따라 Pay-As-You-Go 또는 일일/주간/월간 요금제를 선택한 후 "계속"을 클릭하세요. 신규 사용자는 아래 초대 링크를 통해 등록하시면 RTX 4090 4시간과 CPU 5시간 무료 이용권을 받으실 수 있습니다!

HyperAI 독점 초대 링크(복사하여 브라우저에서 열기):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. 리소스가 할당될 때까지 기다리세요. 첫 번째 복제 프로세스는 약 3분 정도 소요됩니다. 상태가 "실행 중"으로 변경되면 "API 주소" 옆의 화살표를 클릭하여 데모 페이지로 이동하세요. API 주소를 사용하려면 실명 인증을 완료해야 합니다.

효과 시연

실행 페이지에 진입한 후 입력란에 "프롬프트"를 입력하세요. "고급 설정" 옵션에서 고급 매개변수를 설정하고 실행할 수 있습니다. 직접 테스트해 본 결과, Qwen-Image의 텍스트 렌더링 기능은 매우 강력하며, 정확한 글꼴 모양과 깔끔한 조판을 안정적으로 구현할 수 있습니다.

즉각적인:애니메이션 스타일의 소녀. 섬세한 애니메이션 얼굴, 반짝이는 눈, 긴 분홍색 머리카락, 그리고 하얀 리본을 하고 있다. 그녀는 "큐웬-이미지 모델 오픈 소스, 복잡한 텍스트 렌더링과 정밀한 이미지 편집에서 상당한 진전을 이루었습니다."라고 깔끔하게 손으로 쓴 메시지가 적힌 야광 양피지를 들고 있다. 그녀는 마법 학원 제복을 입고 있으며, 배경은 별이 빛나는 서재와 떠다니는 마법의 책, 그리고 입자 조명 효과로 가득하다. 이 작품은 소프트 라이트 필터와 피사계 심도 블러를 적용한 지브리 스타일이다.

프롬프트: 이 포스터는 모란디 색상 팔레트의 부드러운 그라데이션 배경을 사용한 그래픽 디자인을 특징으로 합니다. 기본 색상 팔레트는 회분홍색을 기반으로, 헤이즈 핑크와 오트밀 화이트의 전환 효과를 더했습니다. 핵심 텍스트는 중앙에 배치되었습니다. "Qwen-Image: 고급 텍스트 렌더링 기능을 갖춘 이미지 모델"은 HyperAI 공식 웹사이트(hyper.ai)의 "튜토리얼" 섹션에서 지금 바로 이용할 수 있습니다. 지금 바로 배포하여 전문가 수준의 결과물을 만들어 보세요! 장식 요소는 기본 색상 팔레트에서 뻗어 나오는 추상적인 기하학적 선으로 구성되어 있습니다. 만화 스타일의 애니메이션 로봇이 배경과 대비를 이루며, 은은한 빛의 입자와 구겨진 종이 질감을 더욱 돋보이게 합니다. 텍스트 가장자리는 날카롭고 고르지 않습니다.

위는 HyperAI가 이번에 추천하는 튜토리얼입니다. 누구나 와서 체험해 보세요!

튜토리얼 링크:

https://go.hyper.ai/jmfJQ

온라인 튜토리얼: Qwen-Image, 이미지 편집의 새로운 지평을 열다, 정확한 중국어 렌더링 구현 | 뉴스 | HyperAI초신경