Command Palette
Search for a command to run...
오미니SVG: 통합적 확장 가능한 벡터 그래픽스 생성 모델
오미니SVG: 통합적 확장 가능한 벡터 그래픽스 생성 모델
Yiying Yang Wei Cheng Sijin Chen Xianfang Zeng Fukun Yin Jiaxu Zhang Liao Wang Gang Yu Xingjun Ma Yu-Gang Jiang
초록
스케일러블 벡터 그래픽스(SVG)는 해상도 독립성과 편집 가능성 덕분에 그래픽 디자인 분야에서 널리 채택된 중요한 이미지 포맷이다. AIGC(인공지능 기반 콘텐츠 생성) 분야의 디자이너와 연구자들 사이에서 고품질 SVG 생성 기술에 대한 관심이 지속적으로 높아지고 있다. 그러나 기존의 방법들은 구조가 불규칙한 출력을 생성하며 계산 비용이 막대하거나, 과도하게 단순화된 구조의 흑백 아이콘 생성에 한정되는 한계를 지닌다. 고품질且 복잡한 SVG를 생성하기 위해, 본 연구에서는 사전 훈련된 시각-언어 모델(VLM)을 활용한 엔드투엔드 다모달 SVG 생성을 위한 통합 프레임워크인 OmniSVG를 제안한다. OmniSVG는 SVG 명령어와 좌표를 이산 토큰으로 표현함으로써, 구조적 논리와 저수준 기하학적 정보를 분리함으로써 효율적인 훈련을 가능하게 하면서도, 복잡한 SVG 구조의 표현력을 유지한다. SVG 합성 기술의 발전을 더욱 촉진하기 위해, 두백만 개의 풍부하게 주석이 달린 SVG 자산을 포함하는 다모달 데이터셋 MMSVG-2M과 조건부 SVG 생성 작업을 위한 표준화된 평가 프로토콜을 도입한다. 광범위한 실험 결과를 통해 OmniSVG가 기존 방법들을 능가함을 입증하였으며, 전문적인 SVG 디자인 워크플로우에의 통합 가능성을 보여주었다.