Pose Estimation
الرؤية الحاسوبية هي تقنية تمكن الآلات من تفسير وفهم الصور والفيديوهات. هدفها هو تحقيق التعرف التلقائي وتحليل المشاهد المعقدة من خلال محاكاة نظام الرؤية البشري. تُستخدم هذه التقنية على نطاق واسع في مجالات مثل تشخيص الصور الطبية، القيادة الذاتية، ومراقبة الأمن، مما يعزز الكفاءة والدقة بشكل كبير ويروج لتطور المجتمع الذكي.
!(()&&!|*|*|
Nate
300W (Full)
3DPW
AIC
ApolloCar3D
BRACE
HRNet fine-tuned on BRACE
MS COCO
I²R-Net (1st stage:HRFormer-B)
COCO 2017 val
LOGO-CAP (Ours) HRNet-W48
COCO minival
MSPN
COCO test-dev
ViTPose (ViTAE-G, ensemble)
COCO val2017
MogaNet-B (384x288)
CrowdPose
BUCTD-W48 (w/cond. input from PETR, and generative sampling)
DensePose-COCO
Parsing R-CNN + ResNext101
FLIC Elbows
Stacked Hourglass Networks
FLIC Wrists
Stacked Hourglass Networks
InLoc
GIM-DKM
ITOP front-view
AdaPose
ITOP top-view
DECA-D3
J-HMDB
SimpleBaseline + HANet
KITTI 2015
GeoNet
Leeds Sports Poses
OmniPose
MERL-RAV
SPIGA
MPII
OmniPose (WASPv2)
MPII Human Pose
PCT (swin-l, test set)
MPII Single Person
4xRSN-50
MS-COCO
UniHCP (finetune)
OCHuman
HQNet (ViT-L)
Pix3D
Mid-Level based
SALSA
SubdivNet
UAV-Human
AlphaPose
UPenn Action
OmniPose