الملخص

تُعَرِّض تطور نماذج الرؤية واللغة (VLMs) عقبات ناتجة عن تجزؤ البيئة المُتَوَسِّعَة لقواعد البيانات العامة غير المتجانسة والمُتَلَوِّثة. نُقدِّم "FineVision"، وهو مجموعة نصية مُجمَّعة بدقة وتميِّز بعناية وموحَّدة تضم 24 مليون عينة، أي أكبر مورد مفتوح من نوعه. نُوحِّد أكثر من 200 مصدرًا في 185 مجموعة فرعية من خلال نموذج نشط شبه تلقائي يُشَمِّل مُسَاهِمَةَ الإنسان: حيث تقوم الأتمتة بعملية استيراد جماعي وربط الهياكل (Schema Mapping)، بينما يقوم المراجعون بمراجعة هذه الربطات وفحص عينات من المخرجات للتحقق من الاستهلاك الدقيق للتعليقات، والصيغة المناسبة، والتنوع، والسلامة؛ ويُؤدِّي أي تحدٍّ إلى إجراء إصلاحات مُستهدفة وإعادة تشغيل العمليات. ويُطبَّق في هذا السير العمل أيضًا تكرار مُتَنَوِّع دقيق داخل المصادر وعبرها، إضافةً إلى إزالة التلوث من خلال 66 معيارًا عامًّا. كما تشمل "FineVision" مهامًا تُنفَّذ بواسطة نماذج ذكية (Agentic/GUI) ضمن فضاء إجراءات موحَّد، حيث يُختَبر المراجعون صحة الهياكل وينظرون إلى عينات من المسارات لتأكيد الولاء التنفيذي. وقد أظهرت النماذج المدربة على "FineVision" تفوقًا ثابتًا على النماذج المدربة على المجموعات المفتوحة الحالية في سلسلة واسعة من الاختبارات، مما يُبرز فوائد الحجم الكبير، ونقاء البيانات، والتوازن بين الأتمتة والرقابة البشرية. ونُطلق المجموعة و أدوات التحديد لتعزيز البحث المُركَّز حول البيانات في نماذج الرؤية واللغة.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

FineVision: البيانات المفتوحة هي كل ما تحتاجه

Luis Wiedmann Orr Zohar Amir Mahla Xiaohan Wang Rui Li Thibaud Frere Leandro von Werra Aritra Roy Gosthipaty Andrés Marafioti

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FineVision: البيانات المفتوحة هي كل ما تحتاجه

Luis Wiedmann Orr Zohar Amir Mahla Xiaohan Wang Rui Li Thibaud Frere Leandro von Werra Aritra Roy Gosthipaty Andrés Marafioti

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FineVision: البيانات المفتوحة هي كل ما تحتاجه

Luis Wiedmann Orr Zohar Amir Mahla Xiaohan Wang Rui Li Thibaud Frere Leandro von Werra Aritra Roy Gosthipaty Andrés Marafioti

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters