SRPO: 이미지 생성은 AI에게 작별 인사를 고합니다!

1. 튜토리얼 소개

짓다
특허

SRPO는 텐센트 훈위안 팀, 홍콩 중국대학교 선전 이학부, 그리고 칭화대학교 선전 국제대학원이 2025년 9월 공동으로 출시한 텍스트-이미지 생성 모델입니다. 보상 신호를 텍스트 조건부 신호로 설계함으로써 보상의 온라인 조정을 실현하고 오프라인 보상 미세 조정에 대한 의존도를 줄입니다. SRPO는 Direct-Align 기술을 도입하여 사전 정의된 노이즈 사전 확률 분포를 통해 모든 시간 단계의 원본 이미지를 직접 복원함으로써 이후 시간 단계에서 과도한 최적화 문제를 방지합니다. FLUX.1.dev 모델에 대한 실험 결과, SRPO는 생성된 이미지의 사람이 평가하는 사실감과 미적 품질을 크게 향상시킬 수 있으며, 학습 효율이 매우 높고 최적화를 단 10분 만에 완료할 수 있음을 보여줍니다. 관련 논문 결과는 다음과 같습니다.세밀한 인간 선호도에 맞춰 전체 확산 궤적을 직접 정렬".

이 튜토리얼에서는 단일 A6000 GPU를 컴퓨팅 리소스로 사용합니다. 이 모델은 현재 영어 프롬프트만 지원합니다.

2. 효과 표시

3. 작업 단계

1. 컨테이너를 시작하세요

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

2. 사용 단계

구체적인 매개변수:

  • 프롬프트: 여기에 텍스트 설명을 입력할 수 있습니다.
  • 너비: 이미지 너비.
  • 높이: 이미지의 높이.
  • 안내 척도: 안내 척도는 이미지 생성 중에 텍스트 프롬프트가 최종 결과에 미치는 영향을 제어하는 데 사용됩니다.
  • 추론 단계: 추론 단계의 수는 생성 프로세스의 반복 횟수를 제어하여 생성 품질과 계산 시간에 영향을 미칩니다.
  • 시드: 난수 생성 프로세스의 초기 값을 제어하는 데 사용되는 난수 시드입니다.
  • 사용된 씨앗: 사용된 씨앗.

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{shen2025directlyaligningdiffusiontrajectory,
      title={Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference}, 
      author={Xiangwei Shen and Zhimin Li and Zhantao Yang and Shiyi Zhang and Yingfang Zhang and Donghao Li and Chunyu Wang and Qinglin Lu and Yansong Tang},
      year={2025},
      eprint={2509.06942},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2509.06942}, 
}