Pose Estimation
La vision par ordinateur est une technologie qui permet aux machines d'interpréter et de comprendre les images et les vidéos. Son objectif est d'atteindre une reconnaissance et une analyse automatiques de scènes complexes en simulant le système visuel humain. Cette technologie est largement utilisée dans des domaines tels que le diagnostic d'images médicales, la conduite autonome et la surveillance de sécurité, améliorant considérablement l'efficacité et la précision, et favorisant le développement d'une société intelligente.
!(()&&!|*|*|
Nate
300W (Full)
3DPW
AIC
ApolloCar3D
BRACE
HRNet fine-tuned on BRACE
MS COCO
I²R-Net (1st stage:HRFormer-B)
COCO 2017 val
LOGO-CAP (Ours) HRNet-W48
COCO minival
MSPN
COCO test-dev
ViTPose (ViTAE-G, ensemble)
COCO val2017
MogaNet-B (384x288)
CrowdPose
BUCTD-W48 (w/cond. input from PETR, and generative sampling)
DensePose-COCO
Parsing R-CNN + ResNext101
FLIC Elbows
Stacked Hourglass Networks
FLIC Wrists
Stacked Hourglass Networks
InLoc
GIM-DKM
ITOP front-view
AdaPose
ITOP top-view
DECA-D3
J-HMDB
SimpleBaseline + HANet
KITTI 2015
GeoNet
Leeds Sports Poses
OmniPose
MERL-RAV
SPIGA
MPII
OmniPose (WASPv2)
MPII Human Pose
PCT (swin-l, test set)
MPII Single Person
4xRSN-50
MS-COCO
UniHCP (finetune)
OCHuman
HQNet (ViT-L)
Pix3D
Mid-Level based
SALSA
SubdivNet
UAV-Human
AlphaPose
UPenn Action
OmniPose