
점수 기반 확산 모델(SBDMs)은 쌍 없는 이미지 간 번역(I2I)에서 최고의 FID 성능을 달성하며, 현재 최첨단(SOTA) 성과를 보이고 있다. 그러나 기존의 방법들은 소스 도메인의 훈련 데이터를 완전히 무시하고 있어, 쌍 없는 I2I 작업에서 최적의 해를 도출하지 못하고 있음을 발견하였다. 이를 해결하기 위해, 본 연구에서는 소스 도메인과 타겟 도메인 모두에서 미리 훈련된 에너지 함수를 활용하여, 사전 훈련된 확률 미분 방정식(SDE)의 추론 과정을 안내하는 에너지 지도형 확률 미분 방정식(EGSDE)을 제안한다. 이는 현실성과 충실도를 동시에 고려한 쌍 없는 I2I를 가능하게 한다. 두 개의 특징 추출기 기반으로, 본 연구는 에너지 함수를 정교하게 설계하여, 변환된 이미지가 도메인 독립적 특징을 유지하고 도메인 특화된 특징을 제거하도록 유도한다. 또한 EGSDE를 전문가의 곱(Product of Experts)으로 재해석하여, 세 개의 전문가(SDE와 두 개의 특징 추출기) 각각이 충실도 또는 현실성에만 기여한다는 새로운 해석을 제시한다. 실증적으로, 네 가지 평가 지표를 기준으로 세 가지 널리 쓰이는 쌍 없는 I2I 작업에서 대규모 베이스라인과 EGSDE를 비교하였다. 실험 결과, EGSDE는 거의 모든 설정에서 기존의 SBDM 기반 방법보다 일관되게 우수한 성능을 보였으며, 충실도 성능에 손상을 주지 않은 채 최고 수준의 현실성(FID) 성능을 달성하였다. 더불어, EGSDE는 현실성과 충실도 사이의 유연한 트레이드오프를 가능하게 하며, 하이퍼파라미터 조정을 통해 성능을 추가로 향상시킬 수 있었다(예: AFHQ 데이터셋에서 Cat to Dog 작업에서 FID 51.04, Wild to Dog 작업에서 FID 50.43). 코드는 https://github.com/ML-GSAI/EGSDE 에서 공개되어 있다.