Command Palette
Search for a command to run...
FastVLM: نموذج لغة بصرية سريع للغاية
Date
Size
501.81 MB
License
Other
GitHub
Paper URL
1. مقدمة البرنامج التعليمي

يُعدّ FastVLM، الذي أطلقته شركة Apple في سبتمبر 2025، نموذجًا لغويًا مرئيًا عالي الأداء (VLM) يُحسّن كفاءة وأداء معالجة الصور عالية الدقة. يُقدّم هذا النموذج مُشفّر FastViTHD الهجين الجديد، مما يُقلّل بشكلٍ فعّال عدد الرموز المرئية ويُخفّض وقت التشفير بشكلٍ ملحوظ. مع الحفاظ على أداء مُشابه لنماذج VLM الحالية، يُحسّن FastVLM سرعة المعالجة بشكلٍ كبير؛ فعلى سبيل المثال، في إعداد LLaVA-1.5، يُقلّل وقت توليد أول رمز (TTFT) بمقدار 3.2 مرة مُقارنةً بالنماذج الأخرى. يُقدّم FastVLM أداءً ممتازًا على مُختلف معايير VLM، ويتميز بحجم نموذج أصغر ويتطلب بيانات تدريب أقل، مما يُبرهن على كفاءته وجدواه في مهام الفهم مُتعدد الوسائط. تتوفر أوراق بحثية ذات صلة. FastVLM: ترميز رؤية فعال لنماذج لغة الرؤيةتم إدراجه في مؤتمر CVPR 2025.
يقدم المشروع نموذجين من النماذج:
- فاست في إل إم-0.5 بي
- فاست في إل إم-7 بي
يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة.
2. أمثلة المشاريع

3. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.

4. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@InProceedings{fastvlm2025,
author = {Pavan Kumar Anasosalu Vasu, Fartash Faghri, Chun-Liang Li, Cem Koc, Nate True, Albert Antony, Gokul Santhanam, James Gabriel, Peter Grasch, Oncel Tuzel, Hadi Pouransari},
title = {FastVLM: Efficient Vision Encoding for Vision Language Models},
booktitle = {Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)},
month = {June},
year = {2025},
}Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.