Command Palette
Search for a command to run...
SAM 2: التجزئة في الصور والفيديوهات
SAM 2: التجزئة في الصور والفيديوهات
الملخص
نقدم نموذج التجزئة بأي شيء (SAM 2)، وهو نموذج أساسي يهدف إلى معالجة تجزئة الصور والفيديوهات القابلة للتحفيز. قمنا ببناء محرك بيانات يُحسّن النموذج والبيانات من خلال التفاعل مع المستخدم، لجمع أكبر مجموعة بيانات لتجزئة الفيديو حتى الآن. يعتمد نموذجنا على بنية مبسطة من نوع المحول (Transformer) مزودة بذاكرة تدفقية (Streaming Memory) تُمكّن من معالجة الفيديو في الوقت الفعلي. وعند تدريب SAM 2 على بياناتنا، نلاحظ أداءً قوياً في طيف واسع من المهام. في تجزئة الفيديو، نلاحظ دقة أفضل باستخدام 3 أضعاف التفاعل أقل مقارنةً بالطرق السابقة. وفي تجزئة الصور، يكون نموذجنا أكثر دقة و6 أضعاف أسرع من نموذج التجزئة بأي شيء (SAM). نعتقد أن بياناتنا ونموذجنا ورؤانا ستمثّل نقطة تحول مهمة في مجال تجزئة الفيديو والمهام المرتبطة بالاستشعار البصري. ونُعلن عن إصدار نموذجنا، ونُزوّد ببيانات المجموعة ونُقدّم عرضاً تفاعلياً.