HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم النماذج البصرية n-grams من بيانات الويب

Ang Li* Allan Jabri Armand Joulin Laurens van der Maaten

الملخص

أنظمة التعرف على الصور في العالم الحقيقي تحتاج إلى التعرف على عشرات الآلاف من الفئات التي تشكل مجموعة متنوعة من المفاهيم البصرية. نظرًا لعدم إمكانية استخدام الطريقة التقليدية التي تتطلب تسمية آلاف الصور لكل فئة للتدريب في مثل هذا السيناريو، يتم اللجوء إلى استخدام البيانات المشرف عليها بشكل ويب (webly supervised data). يبحث هذا البحث في تدريب أنظمة التعرف على الصور باستخدام أعداد كبيرة من الصور والتعليقات المرتبطة بها من قبل المستخدمين. وبشكل خاص، نطور نماذج الن-جرام البصريّة التي يمكنها التنبؤ بعبارات عشوائية ذات صلة بمحتوى الصورة. تكون نماذج الن-جرام البصرية لدينا شبكات تلافيفية متقدمة (feed-forward convolutional networks) تم تدريبها باستخدام دوال خسارة جديدة مستوحاة من نماذج الن-جرام الشائعة الاستخدام في نمذجة اللغة. نوضح فوائد نموذجنا في التنبؤ بالعبارات، واسترجاع الصور بناءً على العبارات، وربط الصور بالعناوين، والنقل بدون تصوير (zero-shot transfer).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تعلم النماذج البصرية n-grams من بيانات الويب | مستندات | HyperAI