Command Palette
Search for a command to run...
Luis Wiedmann Orr Zohar Amir Mahla Xiaohan Wang Rui Li Thibaud Frere Leandro von Werra Aritra Roy Gosthipaty Andrés Marafioti

الملخص
تُعَرِّض تطور نماذج الرؤية واللغة (VLMs) عقبات ناتجة عن تجزؤ البيئة المُتَوَسِّعَة لقواعد البيانات العامة غير المتجانسة والمُتَلَوِّثة. نُقدِّم "FineVision"، وهو مجموعة نصية مُجمَّعة بدقة وتميِّز بعناية وموحَّدة تضم 24 مليون عينة، أي أكبر مورد مفتوح من نوعه. نُوحِّد أكثر من 200 مصدرًا في 185 مجموعة فرعية من خلال نموذج نشط شبه تلقائي يُشَمِّل مُسَاهِمَةَ الإنسان: حيث تقوم الأتمتة بعملية استيراد جماعي وربط الهياكل (Schema Mapping)، بينما يقوم المراجعون بمراجعة هذه الربطات وفحص عينات من المخرجات للتحقق من الاستهلاك الدقيق للتعليقات، والصيغة المناسبة، والتنوع، والسلامة؛ ويُؤدِّي أي تحدٍّ إلى إجراء إصلاحات مُستهدفة وإعادة تشغيل العمليات. ويُطبَّق في هذا السير العمل أيضًا تكرار مُتَنَوِّع دقيق داخل المصادر وعبرها، إضافةً إلى إزالة التلوث من خلال 66 معيارًا عامًّا. كما تشمل "FineVision" مهامًا تُنفَّذ بواسطة نماذج ذكية (Agentic/GUI) ضمن فضاء إجراءات موحَّد، حيث يُختَبر المراجعون صحة الهياكل وينظرون إلى عينات من المسارات لتأكيد الولاء التنفيذي. وقد أظهرت النماذج المدربة على "FineVision" تفوقًا ثابتًا على النماذج المدربة على المجموعات المفتوحة الحالية في سلسلة واسعة من الاختبارات، مما يُبرز فوائد الحجم الكبير، ونقاء البيانات، والتوازن بين الأتمتة والرقابة البشرية. ونُطلق المجموعة و أدوات التحديد لتعزيز البحث المُركَّز حول البيانات في نماذج الرؤية واللغة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.