Command Palette
Search for a command to run...
مجموعة بيانات فهم صور المشهد VisualOverload
VisualOverload عبارة عن مجموعة بيانات لتقييم فهم صور المشهد تهدف إلى فحص قدرة النموذج على الفهم البصري والتفكير في التفاصيل في المشاهد المعقدة دون الاعتماد على المعرفة الخارجية.
تحتوي هذه المجموعة من البيانات على 2720 زوجًا من الأسئلة والأجوبة، تتألف من لوحات فنية عالية الدقة، متاحة للعامة، غالبًا ما تتضمن شخصيات وأحداثًا وحبكات فرعية وخلفيات معقدة. صُممت الأسئلة يدويًا لاختبار فهم النموذج للمشهد بشكل شامل. تُعد هذه المجموعة مناسبة لأبحاث الإجابات البصرية، وفهم الصور وتفسيرها بشكل مفصل، وتقييم المشاهد المعقدة ذات الشخصيات والعناصر المتعددة.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.