HyperAIHyperAI

Command Palette

Search for a command to run...

الحث البصري عبر تكميل الصور

Amir Bar Yossi Gandelsman Trevor Darrell Amir Globerson Alexei A. Efros

الملخص

كيف يمكن تكييف نموذج بصرى مُدرب مسبقًا على مهام جديدة لاحقة دون ضبط دقيق خاص بالمهام أو أي تعديل في النموذج؟ مستوحى من التحفيز في معالجة اللغة الطبيعية (NLP)، يبحث هذا البحث في التحفيز البصري: بالنظر إلى مثال(ات) صورة إدخال-إخراج جديد(ة) لمهمة جديدة أثناء الاختبار وصورة إدخال جديدة، الهدف هو إنتاج الصورة الإخراجية تلقائيًا بشكل متوافق مع الأمثلة المعطاة. نوضح أن طرح هذه المشكلة كعملية بسيطة لإكمال الصور (inpainting) - حرفياً مجرد ملء ثقب في صورة تحفيز بصري متصلة - يثبت أنه فعال بشكل مفاجئ، شرط أن يكون خوارزمية الإكمال قد تم تدريبها على البيانات الصحيحة. قمنا بتدريب المُشفِّرات التلقائية المقنَّعة (masked auto-encoders) على مجموعة بيانات جديدة جمعناها - 88 ألف شكل غير مشروح من مصادر أوراق بحثية على موقع Arxiv. نطبق التحفيز البصري على هذه النماذج المُدربة مسبقًا ونعرض النتائج في مجموعة متنوعة من المهام اللاحقة التي تتضمن تحويل الصور إلى صور أخرى، مثل تقسيم الجزء الأمامي، اكتشاف كائن واحد، تلوين الصور، اكتشاف الحواف وغيرها.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الحث البصري عبر تكميل الصور | مستندات | HyperAI