이미지 생성
이미지 생성(합성)은 기존 데이터셋에서 새로운 이미지를 생성하는 작업입니다. 무조건적 생성은 데이터셋에서 무작위로 샘플을 생성하는 것을 의미하며, 즉 \(p(y)\)를 나타냅니다. 반면 조건부 생성은 데이터셋의 레이블을 기반으로 샘플을 생성하는 것을 의미하며, 즉 \(p(y|x)\)를 나타냅니다. 이 섹션에서는 최신 무조건적 생성 리더보드를 소개하고 있으며, 다른 유형의 이미지 생성은 하위 작업에서 확인할 수 있습니다. 이미지 생성은 컴퓨터 비전 분야에서 중요한 응용 가치를 지니고 있으며, 데이터 증강, 예술 창작, 가상 현실 등 다양한 분야에서 활용됩니다.
ImageNet 256x256
Discriminator Guidance
CIFAR-10
GMem
ImageNet 64x64
CTM (NFE 1)
FFHQ 256 x 256
Anycost GAN
ImageNet 512x512
MAGVIT-v2
CelebA 64x64
HDCGAN
ImageNet 32x32
StyleGAN-XL
LSUN Bedroom 256 x 256
StyleGAN (DINOv2)
STL-10
LSUN Churches 256 x 256
BOSS
ImageNet 128x128
ADM-G
FFHQ 1024 x 1024
Efficient-VDVAE
CelebA-HQ 256x256
BOSS
CelebA 256x256
StyleSwin
MNIST
Locally Masked PixelCNN (8 orders)
FFHQ-U
Alias-Free-R
FFHQ
Anycost GAN
Binarized MNIST
CR-NVAE
CelebA-HQ 1024x1024
StyleSwin
CIFAR-100
LeCAM (StyleGAN2 + ADA)
AFHQ Cat
Vision-aided GAN
LSUN Cat 256 x 256
Projected GAN
AFHQV2
Polarity-StyleGAN3
CelebA-HQ 128x128
COCO-GAN
Fashion-MNIST
GLF+perceptual loss (ours)
TextAtlasEval
AFHQ Dog
Vision-aided GAN
Cityscapes
GANformer
CLEVR
Projected GAN
LSUN Horse 256 x 256
StyleGAN2
AFHQ Wild
Vision-aided GAN
CelebA 128x128
U-Net GAN
Places50
SinDiffusion
ARKitScenes
GAUDI
CUB 128 x 128
Projected GAN
Pokemon 256x256
StyleGAN-XL
Replica
Stanford Cars
Projected GANs
Stanford Dogs
Projected GAN
VizDoom
VLN-CE
ADE-Indoor
CAT 256x256
StyleGAN2 + DA + RLC (Ours)
CelebA-HQ 64x64
COCO-GAN
CIFAR-10 (10% data)
DiffAugment-StyleGAN2
CIFAR-10 (20% data)
DiffAugment-StyleGAN2
FFHQ 128 x 128
Anycost GAN
FFHQ 512 x 512
Anycost GAN
LSUN Bedroom
StyleGAN
LSUN Bedroom 64 x 64
WGAN-GP + TTUR + Alex-Adam
MetFaces
MetFaces-U
ObjectsRoom
Pokemon 1024x1024
StyleGAN-XL
ShapeStacks
Stacked MNIST
VAEBM
AFHQ-v2 64x64
FFHQ 64x64
SiDA-EDM
iNaturalist 2019
StyeGAN2 + NoisyTwins
LSUN Bedroom 128 x 128
LadaGAN
LSUN Car 512 x 384
Polarity-StyleGAN2
Oxford 102 Flowers 256 x 256
MSG-StyleGAN
RC-49
cDR-RS
25% ImageNet 128x128
LeCAM + DA
CelebA
CelebA-HQ
DDPM
CelebA-HQ 512x512
WaveDiff
Cityscapes-25K 256x512
SB-GAN
Cityscapes-5K 256x512
SB-GAN
EMNIST-Letters
Spiking-Diffusion
FFHQ 64x64 - 4x upscaling
PFGM++
GQN
ImageNet 256x256 - 1 labeled data per class
ImageNet 256x256 - 1% labeled data
DPT
ImageNet 256x256 - 2 labeled data per class
ImageNet 256x256 - 5 labeled data per class
Indian Celebs 256 x 256
MSG-StyleGAN
KMNIST
Landscapes 256 x 256
CIPS
LLVIP
pix2pix
LSUN
BigGAN + gSR
LSUN Car 256 x 256
StyleGAN2
LSUN tower 64x64
DDPM-IP
Multi-dSprites
GENESIS
NASA Perseverance
Oxford 102 Flowers 128x128
QSNGAN
Satellite-Buildings 256 x 256
CIPS
Satellite-Landscapes 256 x 256
CIPS
SDSS Galaxies