HyperAI

الرئيسية

الصفحة الرئيسية

GPU

وحدة التحكم
التوثيق
التسعير

Pulse

الأخبار

الموارد

الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي

الاختبارات القياسية

SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU

المجتمع

الفعاليات

أدوات

حول شروط الخدمة سياسة الخصوصية
العربية

Command Palette

Search for a command to run...

HyperAI
SOTA
التعرف على الأفعال

التعرف على الأفعال

التعرف على الأفعال هو مهمة في مجال رؤية الحاسوب تهدف إلى تحديد تصنيف سلوكيات البشر من خلال مقاطع الفيديو أو الصور. هدفها هو تصنيف الأفعال التي يتم تنفيذها في مقاطع الفيديو أو الصور إلى فئات أفعال محددة مسبقًا، مما يحقق كشفًا دقيقًا وفهمًا للأفعال. تحتل هذه المهمة أهمية كبيرة في التطبيقات مثل مراقبة الفيديو، التفاعل بين الإنسان والحاسوب، وتحليل الرياضات. ومع ذلك، فإن تحدي بناء قواعد بيانات فيديو كبيرة قد أدى إلى أن تكون معظم المعايير الموجودة للتعرف على الأفعال نسبيًا صغيرة، عادة ما تحتوي على حوالي 10 ألف فيديو فقط.

Something-Something V2

MSNet-R50En (8+16 ensemble, ImageNet pretrained)

Something-Something V1

VideoMAE (K700 pretrain+finetune, ViT-L, 16x4)

EPIC-KITCHENS-100

PoseC3D (RGB + Pose)

PoseC3D (RGB + Pose)

Text4Vis (w/ ViT-L)

H2O (2 Hands and Objects)

HandFormer-B/21x8

ip-CSN-152 (RGB)

LaViLa (Finetuned, TimeSformer-L)

PoseC3D (Pose Only)

Real Life Violence Situations Dataset

Jester (Gesture Recognition)

SEW-Resnet18 (3sets)

Win-Fail Action Understanding

VIRAT Ground 2.0

EPIC-KITCHENS-55

Skeleton-Mimetics

ابنِ مستقبل الذكاء الاصطناعي

حول

من نحن دعم مجموعة البيانات

المنتجات

الأخبار الأوراق البحثية دفاتر تفاعلية مجموعات بيانات ويكي

الروابط

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

الرئيسية

الصفحة الرئيسية

GPU

وحدة التحكم
التوثيق
التسعير

Pulse

الأخبار

الموارد

الأوراق البحثية
دفاتر تفاعلية
مجموعات بيانات
ويكي

الاختبارات القياسية

SOTA
نماذج اللغة الكبيرة (LLM)
لوحة صدارة وحدات معالجة الرسوميات GPU

المجتمع

الفعاليات

أدوات

حول شروط الخدمة سياسة الخصوصية
العربية

Command Palette

Search for a command to run...

HyperAI
SOTA
التعرف على الأفعال

التعرف على الأفعال

التعرف على الأفعال هو مهمة في مجال رؤية الحاسوب تهدف إلى تحديد تصنيف سلوكيات البشر من خلال مقاطع الفيديو أو الصور. هدفها هو تصنيف الأفعال التي يتم تنفيذها في مقاطع الفيديو أو الصور إلى فئات أفعال محددة مسبقًا، مما يحقق كشفًا دقيقًا وفهمًا للأفعال. تحتل هذه المهمة أهمية كبيرة في التطبيقات مثل مراقبة الفيديو، التفاعل بين الإنسان والحاسوب، وتحليل الرياضات. ومع ذلك، فإن تحدي بناء قواعد بيانات فيديو كبيرة قد أدى إلى أن تكون معظم المعايير الموجودة للتعرف على الأفعال نسبيًا صغيرة، عادة ما تحتوي على حوالي 10 ألف فيديو فقط.

Something-Something V2

MSNet-R50En (8+16 ensemble, ImageNet pretrained)

Something-Something V1

VideoMAE (K700 pretrain+finetune, ViT-L, 16x4)

EPIC-KITCHENS-100

PoseC3D (RGB + Pose)

PoseC3D (RGB + Pose)

Text4Vis (w/ ViT-L)

H2O (2 Hands and Objects)

HandFormer-B/21x8

ip-CSN-152 (RGB)

LaViLa (Finetuned, TimeSformer-L)

PoseC3D (Pose Only)

Real Life Violence Situations Dataset

Jester (Gesture Recognition)

SEW-Resnet18 (3sets)

Win-Fail Action Understanding

VIRAT Ground 2.0

EPIC-KITCHENS-55

Skeleton-Mimetics

ابنِ مستقبل الذكاء الاصطناعي

حول

من نحن دعم مجموعة البيانات

المنتجات

الأخبار الأوراق البحثية دفاتر تفاعلية مجموعات بيانات ويكي

الروابط

© HyperAI

GitHub Discord X (formerly Twitter)