Back to Headlines

구글, 3D 시각 편집 혁신 'BlenderFusion' 공개… 복잡한 장면도 손쉽게 생성하고 편집 가능

3일 전

구글이 3D 시각 편집과 생성 합성 기술을 혁신한 새로운 프레임워크 '블렌더퓨전(BlenderFusion)'을 공개했다. 기존의 생성적 적대 신경망(GAN)과 확산 모델은 전체 이미지 생성에 강점이 있지만, 여러 시각적 요소를 정밀하게 제어하기에는 한계가 있었다. 블렌더퓨전은 이를 보완하기 위해 분층, 편집, 합성의 세 단계로 구성된 워크플로우를 도입했다. 먼저 분층 단계에서 입력된 2D 이미지에서 객체를 추출해 3D 포인트 클라우드로 변환한다. 이 과정에 SAM2와 DepthPro 같은 최신 시각 기반 모델을 활용해 정확한 객체 인식과 깊이 정보를 확보한다. 이후 편집 단계에서 사용자는 블렌더의 강력한 도구를 통해 3D 객체를 이동, 회전, 확대 축소하거나 재질과 외관을 세밀하게 조정할 수 있다. 편집 내용은 즉각적으로 렌더링 결과에 반영돼 직관적인 작업이 가능하다. 마지막 합성 단계에서는 편집된 3D 장면을 원본 배경과 자연스럽게 융합한다. 기존 확산 모델을 개선해 편집 정보와 원본 장면의 세부 사항을 효과적으로 통합함으로써 고해상도이고 일관성 있는 최종 이미지를 생성한다. 이 프레임워크는 디자이너와 크리에이터가 복잡한 3D 시각 작업을 보다 쉽게 수행할 수 있도록 지원하며, 구글의 3D 생성 기술 발전을 보여주는 중요한 성과다. 자세한 정보는 공식 사이트에서 확인할 수 있다.

Related Links