HyperAI

Visual Prompt Tuning

تuning البصرية (VPT) هي طريقة تحسين معلمات فعالة تضيف عددًا صغيرًا من المعلمات القابلة للتعلم والمحددة للمهمة في فضاء الإدخال مع تجميد النواة المسبقة التدريب من نوع Transformer. أثناء تدريب المهام اللاحقة، يتم تحسين هذه المعلمات مع الرأس الخطي. تتميز VPT بأدائها الجيد في بيئات البيانات المنخفضة وتحافظ على ميزتها عبر مختلف مستويات حجم البيانات. بالإضافة إلى ذلك، فإن VPT تنافسية مع مختلف أحجام وتصاميم Transformers (مثل ViTBase/Large/Huge، Swin)، مما يجعلها نهجًا فعالًا للتكيف مع شبكات النواة البصرية المتزايدة.