Pose Estimation
コンピュータビジョンは、機械が画像や動画を解釈し理解する技術です。この技術の目的は、人間の視覚システムを模倣することで複雑なシーンの自動認識と分析を実現することです。コンピュータビジョンは医療画像診断、自動運転、セキュリティ監視などの分野で広く応用されており、効率性和正確性を大幅に向上させ、知能社会の発展に貢献しています。
!(()&&!|*|*|
Nate
300W (Full)
3DPW
AIC
ApolloCar3D
BRACE
HRNet fine-tuned on BRACE
MS COCO
I²R-Net (1st stage:HRFormer-B)
COCO 2017 val
LOGO-CAP (Ours) HRNet-W48
COCO minival
MSPN
COCO test-dev
ViTPose (ViTAE-G, ensemble)
COCO val2017
MogaNet-B (384x288)
CrowdPose
BUCTD-W48 (w/cond. input from PETR, and generative sampling)
DensePose-COCO
Parsing R-CNN + ResNext101
FLIC Elbows
Stacked Hourglass Networks
FLIC Wrists
Stacked Hourglass Networks
InLoc
GIM-DKM
ITOP front-view
AdaPose
ITOP top-view
DECA-D3
J-HMDB
SimpleBaseline + HANet
KITTI 2015
GeoNet
Leeds Sports Poses
OmniPose
MERL-RAV
SPIGA
MPII
OmniPose (WASPv2)
MPII Human Pose
PCT (swin-l, test set)
MPII Single Person
4xRSN-50
MS-COCO
UniHCP (finetune)
OCHuman
HQNet (ViT-L)
Pix3D
Mid-Level based
SALSA
SubdivNet
UAV-Human
AlphaPose
UPenn Action
OmniPose