HyperAIHyperAI

Command Palette

Search for a command to run...

SAM3: نموذج التجزئة المرئية

Date

منذ 2 أشهر

Size

414.85 MB

License

Other

Paper URL

2511.16719

1. مقدمة البرنامج التعليمي

يبني
رخصة

SAM3 هو نموذج متطور للرؤية الحاسوبية أطلقته شركة Meta AI في نوفمبر 2025. يتميز هذا النموذج بقدرته على اكتشاف وتجزئة وتتبع الأجسام في الصور والفيديوهات باستخدام النصوص والأمثلة والإشارات البصرية. يدعم النموذج إدخال العبارات من مفردات مفتوحة، ويتمتع بقدرات تفاعلية قوية متعددة الوسائط، كما يمكنه تصحيح نتائج التجزئة في الوقت الفعلي. يقدم SAM3 أداءً فائقًا في مهام تجزئة الصور والفيديوهات، متفوقًا على الأنظمة الحالية بضعف الأداء، ويدعم التعلم بدون بيانات تدريبية. يمتد النموذج ليشمل إعادة بناء ثلاثية الأبعاد، مما يدعم تطبيقات في سيناريوهات متنوعة مثل معاينات المنازل، وتحرير الفيديو الإبداعي، والبحث العلمي، موفرًا بذلك دفعة قوية لتطوير الرؤية الحاسوبية مستقبلًا. تتوفر أوراق بحثية ذات صلة. سام 3: تقسيم أي شيء إلى مفاهيم .

يستخدم هذا البرنامج التعليمي بطاقة رسومات RTX 5090 واحدة افتراضيًا، ولكن يمكن البدء ببطاقة رسومات RTX 4090 واحدة على الأقل. تتوفر ثلاثة أمثلة للاختبار: تجزئة الصورة، ونص الفيديو، ونقطة/مربع الفيديو. يدعم النموذج الإدخال باللغة الإنجليزية فقط.

2. عرض التأثير

جولدن ريتريفر بني
اللاعبون يرتدون القمصان البيضاء

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.

1. تقسيم الصورة

المعلمات المحددة:

  • موجه النص: يمكنك إدخال النص هنا.
  • عتبة الاكتشاف: كلما زادت العتبة، قل عدد الأهداف التي يتم اكتشافها.
  • عتبة القناع: كلما كانت العتبة أعلى، أصبحت حدود القناع المولدة أكثر وضوحًا وحدة.

2. مطالبة نص الفيديو

المعلمات المحددة:

  • موجه النص: يمكنك إدخال النص هنا.
  • الانتشار عبر الفيديو: انقر فوق هذا الزر لتنفيذ عملية تتبع الفيديو للهدف.

3. مطالبة نقطة/مربع الفيديو

المعلمات المحددة:

  • معرف الكائن: معرف الهدف المكتشف.
  • تسمية النقطة:
    • إيجابي: عندما تنقر على موقع في الصورة، إذا كان موجبًا، فهذا يعني أن هذه النقطة تنتمي إلى الكائن المستهدف الذي تريد تجزئته، لذا يرجى تضمينه في الحساب.
    • سلبي: عند النقر فوق مكان ما في الصورة، إذا كان سلبيا، فهذا يعني أن هذه النقطة لا تنتمي إلى الكائن المستهدف (إنها الخلفية أو شيء آخر)، يرجى إزالتها.
  • مسح المدخلات القديمة لهذا الكائن: ما إذا كان سيتم مسح الأهداف التي تم اكتشافها مسبقًا.
  • نوع المطالبة:
    • النقاط: انقر فوق الإشارات المرئية.
    • الصناديق: إشارات بصرية لاختيار العناصر.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@misc{carion2025sam3segmentconcepts,
      title={SAM 3: Segment Anything with Concepts},
      author={Nicolas Carion and Laura Gustafson and Yuan-Ting Hu and Shoubhik Debnath and Ronghang Hu and Didac Suris and Chaitanya Ryali and Kalyan Vasudev Alwala and Haitham Khedr and Andrew Huang and Jie Lei and Tengyu Ma and Baishan Guo and Arpit Kalla and Markus Marks and Joseph Greer and Meng Wang and Peize Sun and Roman Rädle and Triantafyllos Afouras and Effrosyni Mavroudi and Katherine Xu and Tsung-Han Wu and Yu Zhou and Liliane Momeni and Rishi Hazra and Shuangrui Ding and Sagar Vaze and Francois Porcher and Feng Li and Siyuan Li and Aishwarya Kamath and Ho Kei Cheng and Piotr Dollár and Nikhila Ravi and Kate Saenko and Pengchuan Zhang and Christoph Feichtenhofer},
      year={2025},
      eprint={2511.16719},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2511.16719},
}

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp