HyperAI

Image Generation

La génération d'images (synthèse) est la tâche de créer de nouvelles images à partir d'un ensemble de données existant. La génération inconditionnelle fait référence à la création d'échantillons sans condition particulière à partir de l'ensemble de données, c'est-à-dire \(p(y)\) ; tandis que la génération conditionnelle implique la création d'échantillons basés sur des étiquettes de l'ensemble de données, c'est-à-dire \(p(y|x)\). Cette section présente le dernier classement pour la génération inconditionnelle, tandis que d'autres types de génération d'images peuvent être consultés dans les sous-tâches. La génération d'images a une valeur d'application importante en vision par ordinateur, étant utile pour l'augmentation de données, la création artistique et la réalité virtuelle, entre autres domaines.

25% ImageNet 128x128
LeCAM + DA
ADE-Indoor
AFHQ Cat
Stylegan2-ada (NVIDIA pre-trained)
AFHQ Dog
Vision-aided GAN
AFHQ-v2 64x64
AFHQ Wild
Diffusion InsGen
AFHQV2
Polarity-StyleGAN3
ARKitScenes
GAUDI
Binarized MNIST
CR-NVAE
CAT 256x256
StyleGAN2 + DA + RLC (Ours)
CelebA
CelebA 128x128
U-Net GAN
CelebA 256x256
StyleSwin
CelebA 64x64
Diffusion StyleGAN2
CelebA-HQ
DDPM
CelebA-HQ 1024x1024
StyleSwin
CelebA-HQ 128x128
U-Net GAN
CelebA-HQ 256x256
BOSS
CelebA-HQ 512x512
WaveDiff
CelebA-HQ 64x64
COCO-GAN
CIFAR-10
GMem
CIFAR-10 (10% data)
DiffAugment-StyleGAN2
CIFAR-10 (20% data)
DiffAugment-StyleGAN2
CIFAR-100
LeCAM (StyleGAN2 + ADA)
Cityscapes
Projected GAN
Cityscapes-25K 256x512
SB-GAN
Cityscapes-5K 256x512
SB-GAN
CLEVR
Projected GAN
CUB 128 x 128
Projected GAN
EMNIST-Letters
Spiking-Diffusion
Fashion-MNIST
GLF+perceptual loss (ours)
FFHQ
Anycost GAN
FFHQ 1024 x 1024
StyleSAN-XL
FFHQ 128 x 128
DDPM-IP
FFHQ 256 x 256
Anycost GAN
FFHQ 512 x 512
StyleGAN-XL
FFHQ 64x64
SiDA-EDM
FFHQ 64x64 - 4x upscaling
PFGM++
FFHQ-U
Alias-Free-R
GQN
ImageNet 128x128
ADM-G
ImageNet 256x256
xAR-H
ImageNet 256x256 - 1% labeled data
DPT
ImageNet 256x256 - 1 labeled data per class
ImageNet 256x256 - 2 labeled data per class
ImageNet 256x256 - 5 labeled data per class
ImageNet 32x32
PaGoDA
ImageNet 512x512
EDM2- XXL Autoguidance (M, T /3.5)
ImageNet 64x64
CTM (NFE 1)
iNaturalist 2019
StyeGAN2 + NoisyTwins
Indian Celebs 256 x 256
MSG-StyleGAN
KMNIST
Landscapes 256 x 256
CIPS
LLVIP
pix2pix
LSUN
BigGAN + gSR
LSUN Bedroom
StyleGAN
LSUN Bedroom 128 x 128
LadaGAN
LSUN Bedroom 256 x 256
Diffusion ProjectedGAN
LSUN Bedroom 64 x 64
WGAN-GP + TTUR + Alex-Adam
LSUN Car 256 x 256
StyleGAN2
LSUN Car 512 x 384
Polarity-StyleGAN2
LSUN Cat 256 x 256
Projected GAN
LSUN Churches 256 x 256
BOSS
LSUN Horse 256 x 256
StyleGAN2
LSUN tower 64x64
DDPM-IP
MetFaces
MetFaces-U
MNIST
Transition Matrix
Multi-dSprites
GENESIS
NASA Perseverance
ObjectsRoom
Oxford 102 Flowers 128x128
QSNGAN
Oxford 102 Flowers 256 x 256
Projected GAN
Places50
SinDiffusion
Pokemon 1024x1024
StyleGAN-XL
Pokemon 256x256
StyleGAN-XL
RC-49
cDR-RS
Replica
Satellite-Buildings 256 x 256
CIPS
Satellite-Landscapes 256 x 256
CIPS
SDSS Galaxies
ShapeStacks
Stacked MNIST
VAEBM
Stanford Cars
Projected GANs
Stanford Dogs
Projected GAN
STL-10
TextAtlasEval
VizDoom
VLN-CE