Command Palette
Search for a command to run...
Hyunmin Cho Donghoon Ahn Susung Hong Jee Eun Kim Seungryong Kim Kyong Hwan Jin

초록
최근의 확산 모델은 이미지 생성 분야에서 최고 성능을 달성하고 있으나, 종종 의미적 불일치나 환각 현상에 취약하다. 다양한 추론 시 가이던스 방법은 생성 품질을 향상시킬 수 있으나, 보통 외부 신호나 아키텍처 수정에 의존하는 간접적인 방식을 취하기 때문에 추가적인 계산 부담을 수반한다. 본 논문에서는 기존 확산 모델의 구조를 변경하지 않고, 단지 샘플링 경로 신호에만 기반하여 작동하는 더 효율적이고 직접적인 가이던스 방법인 접선 증폭 가이던스(Tangential Amplifying Guidance, TAG)를 제안한다. TAG는 중간 샘플을 사영 기저로 활용하고, 추정된 스코어의 접선 성분을 이 기저에 대해 증폭함으로써 샘플링 경로를 보정한다. 본 가이던스 과정은 1차 테일러 전개를 활용하여 수학적으로 정식화되며, 접선 성분을 증폭하는 것이 확률이 높은 영역으로 상태를 유도함을 보여준다. 이는 의미적 불일치를 감소시키고 샘플 품질을 향상시키는 데 기여한다. TAG는 플러그 앤 플레이(Plug-and-Play), 아키텍처 독립적인 모듈로서, 거의 추가적인 계산 비용 없이 확산 샘플링의 정밀도를 향상시킬 수 있으며, 확산 가이던스에 대한 새로운 관점을 제시한다.