SAM3: نموذج التجزئة المرئية
1. مقدمة البرنامج التعليمي

SAM3 هو نموذج متقدم للرؤية الحاسوبية، أطلقته شركة Meta AI في نوفمبر 2025. يستطيع هذا النموذج اكتشاف الكائنات في الصور والفيديوهات وتجزئتها وتتبعها باستخدام النصوص والأمثلة والإشارات البصرية. يدعم إدخال العبارات بمفردات مفتوحة، ويتميز بقدرات تفاعلية قوية عبر الوسائط، ويمكنه تصحيح نتائج التجزئة آنيًا. يقدم SAM3 أداءً فائقًا في مهام تجزئة الصور والفيديوهات، متفوقًا على الأنظمة الحالية بضعف الأداء، ويدعم التعلم الآلي. يمتد هذا النموذج ليشمل إعادة بناء الصور ثلاثية الأبعاد، ويدعم تطبيقات في سيناريوهات مختلفة مثل معاينات الشاشة الرئيسية، وتحرير الفيديو الإبداعي، والبحث العلمي، مما يوفر زخمًا قويًا لتطوير الرؤية الحاسوبية مستقبلًا. تتوفر أوراق بحثية ذات صلة على [رابط الورقة البحثية ذات الصلة].سام 3: تقسيم أي شيء إلى مفاهيم".
يستخدم هذا البرنامج التعليمي بطاقة رسومات RTX 5090 واحدة افتراضيًا، ولكن يمكن البدء ببطاقة رسومات RTX 4090 واحدة على الأقل. تتوفر ثلاثة أمثلة للاختبار: تجزئة الصورة، ونص الفيديو، ونقطة/مربع الفيديو. يدعم النموذج الإدخال باللغة الإنجليزية فقط.
2. عرض التأثير


3. خطوات التشغيل
1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.
1. تقسيم الصورة

المعلمات المحددة:
- موجه النص: يمكنك إدخال النص هنا.
- عتبة الاكتشاف: كلما زادت العتبة، قل عدد الأهداف التي يتم اكتشافها.
- عتبة القناع: كلما كانت العتبة أعلى، أصبحت حدود القناع المولدة أكثر وضوحًا وحدة.
2. مطالبة نص الفيديو

المعلمات المحددة:
- موجه النص: يمكنك إدخال النص هنا.
- الانتشار عبر الفيديو: انقر فوق هذا الزر لتنفيذ عملية تتبع الفيديو للهدف.
3. مطالبة نقطة/مربع الفيديو

المعلمات المحددة:
- معرف الكائن: معرف الهدف المكتشف.
- تسمية النقطة:
- إيجابي: عندما تنقر على موقع في الصورة، إذا كان موجبًا، فهذا يعني أن هذه النقطة تنتمي إلى الكائن المستهدف الذي تريد تجزئته، لذا يرجى تضمينه في الحساب.
- سلبي: عند النقر فوق مكان ما في الصورة، إذا كان سلبيا، فهذا يعني أن هذه النقطة لا تنتمي إلى الكائن المستهدف (إنها الخلفية أو شيء آخر)، يرجى إزالتها.
- مسح المدخلات القديمة لهذا الكائن: ما إذا كان سيتم مسح الأهداف التي تم اكتشافها مسبقًا.
- نوع المطالبة:
- النقاط: انقر فوق الإشارات المرئية.
- الصناديق: إشارات بصرية لاختيار العناصر.

معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@misc{carion2025sam3segmentconcepts,
title={SAM 3: Segment Anything with Concepts},
author={Nicolas Carion and Laura Gustafson and Yuan-Ting Hu and Shoubhik Debnath and Ronghang Hu and Didac Suris and Chaitanya Ryali and Kalyan Vasudev Alwala and Haitham Khedr and Andrew Huang and Jie Lei and Tengyu Ma and Baishan Guo and Arpit Kalla and Markus Marks and Joseph Greer and Meng Wang and Peize Sun and Roman Rädle and Triantafyllos Afouras and Effrosyni Mavroudi and Katherine Xu and Tsung-Han Wu and Yu Zhou and Liliane Momeni and Rishi Hazra and Shuangrui Ding and Sagar Vaze and Francois Porcher and Feng Li and Siyuan Li and Aishwarya Kamath and Ho Kei Cheng and Piotr Dollár and Nikhila Ravi and Kate Saenko and Pengchuan Zhang and Christoph Feichtenhofer},
year={2025},
eprint={2511.16719},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2511.16719},
}بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.