HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 14 أيام

FineVision: البيانات المفتوحة هي كل ما تحتاجه

Luis Wiedmann Orr Zohar Amir Mahla Xiaohan Wang Rui Li Thibaud Frere Leandro von Werra Aritra Roy Gosthipaty Andrés Marafioti

FineVision: البيانات المفتوحة هي كل ما تحتاجه

الملخص

تُعَرِّض تطور نماذج الرؤية واللغة (VLMs) عقبات ناتجة عن تجزؤ البيئة المُتَوَسِّعَة لقواعد البيانات العامة غير المتجانسة والمُتَلَوِّثة. نُقدِّم "FineVision"، وهو مجموعة نصية مُجمَّعة بدقة وتميِّز بعناية وموحَّدة تضم 24 مليون عينة، أي أكبر مورد مفتوح من نوعه. نُوحِّد أكثر من 200 مصدرًا في 185 مجموعة فرعية من خلال نموذج نشط شبه تلقائي يُشَمِّل مُسَاهِمَةَ الإنسان: حيث تقوم الأتمتة بعملية استيراد جماعي وربط الهياكل (Schema Mapping)، بينما يقوم المراجعون بمراجعة هذه الربطات وفحص عينات من المخرجات للتحقق من الاستهلاك الدقيق للتعليقات، والصيغة المناسبة، والتنوع، والسلامة؛ ويُؤدِّي أي تحدٍّ إلى إجراء إصلاحات مُستهدفة وإعادة تشغيل العمليات. ويُطبَّق في هذا السير العمل أيضًا تكرار مُتَنَوِّع دقيق داخل المصادر وعبرها، إضافةً إلى إزالة التلوث من خلال 66 معيارًا عامًّا. كما تشمل "FineVision" مهامًا تُنفَّذ بواسطة نماذج ذكية (Agentic/GUI) ضمن فضاء إجراءات موحَّد، حيث يُختَبر المراجعون صحة الهياكل وينظرون إلى عينات من المسارات لتأكيد الولاء التنفيذي. وقد أظهرت النماذج المدربة على "FineVision" تفوقًا ثابتًا على النماذج المدربة على المجموعات المفتوحة الحالية في سلسلة واسعة من الاختبارات، مما يُبرز فوائد الحجم الكبير، ونقاء البيانات، والتوازن بين الأتمتة والرقابة البشرية. ونُطلق المجموعة و أدوات التحديد لتعزيز البحث المُركَّز حول البيانات في نماذج الرؤية واللغة.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
FineVision: البيانات المفتوحة هي كل ما تحتاجه | الأوراق البحثية | HyperAI