HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم نماذج التعلم الصفرية العامة لموقع الصور في المجال المفتوح

Lukas Haas Silas Alberti Michal Skreta

الملخص

تحديد موقع الصورة الجغرافي هو مهمة صعبة تتمثل في التنبؤ بالإحداثيات الجغرافية لمصدر صورة معينة. وهي مشكلة غير محلولة تعتمد على القدرة على دمج العلامات البصرية بالمعرفة العامة عن العالم لتقديم توقعات دقيقة عبر مختلف المناطق الجغرافية. نقدم \href\href{https://huggingface.co/geolocal/StreetCLIP}{\text{StreetCLIP}}\href، وهو نموذج أساسي متين ومتوفر للعامة، ليس فقط يحقق أداءً رائدًا في مجال المعايير المتعددة لتحديد موقع الصور الجغرافي في المجالات المفتوحة، بل يقوم بذلك أيضًا في بيئة التعلم بدون تصوير (zero-shot setting)، متفوقًا على النماذج المشرف عليها التي تم تدريبها على أكثر من 4 ملايين صورة.طريقتنا تقدم نهجًا للمETA-تعلم للتعلم بدون تصوير (zero-shot learning) بشكل عام من خلال التدريب الأولي لـ CLIP باستخدام العناوين المصطنعة، مما يجعل CLIP متأصلًا في مجال اختياري. نظهر أن طryptonا تقوم بنقل قدرات التعلم بدون تصوير (zero-shot) العامة لـ CLIP إلى مجال تحديد موقع الصور الجغرافي بشكل فعال، مما يحسن الأداء العام للتعلم بدون تصوير داخل هذا المجال دون الحاجة إلى تعديل StreetCLIP على مجموعة ثابتة من الفئات.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp