HyperAI

في تطور مثير في مجال الذكاء الصناعي، قدم فريق من الباحثين في معهد بحوث البرمجيات التابع لأكاديمية العلوم الصينية استراتيجية جديدة لأخذ عينات البيانات بالجملة الصغيرة. هذا الأسلوب يهدف إلى القضاء على التأثيرات السلبية للروابط الزائفة التي تحدث بسبب متغيرات غير قابلة للملاحظة على عملية التعلم التلقائي دون إشراف. التعلم التلقائي دون إشراف هو تقنية تتيح للنماذج اكتساب المعرفة من البيانات دون الحاجة إلى تسميتها بشكل مباشر. ومع ذلك، قد تتعرض هذه النماذج للتشويش من متغيرات غير مرتبطة بمهمة التعلم الأساسية، مما يؤثر سلبًا على قدرتها على التعامل مع بيانات اختبار تختلف عن البيانات التي تم تدريبها عليها. هذه المشكلة تعرف باسم ضعف القدرة على التعميم خارج التوزيع. لفريق البحث الصيني، الحل جاء في شكل استراتيجية أخذ عينات بيانات بالجملة الصغيرة، والتي تعتمد على تقدير الآثار السببية. تتم هذه العملية من خلال تعلم نموذج متغيرات خفية يمكنه تقدير التوزيع الاحتمالي اللاحق لمتغيرات الدلالات غير القابلة للملاحظة، وترمز هذه القيم كدرجات توازن. بعد ذلك، يتم وضع العينات التي لديها درجات توازن متطابقة أو قريبة في نفس الجملة الصغيرة لضمان الاستقلالية الشرطية لمتغيرات الدلالات غير القابلة للملاحظة داخل كل جملة صغيرة. تم اختبار هذه الاستراتيجية على عدة مجموعات بيانات مرجعية، حيث تم الاستبدال فقط في آلية توليد الجمل، دون الحاجة لتعديل الهيكل العام للنموذج أو معلماته الفائقة. وقد أظهرت التجارب أن هذه الاستراتيجية تحسن أداء الطرق الرائدة حاليًا في التعلم التلقائي دون إشراف بنسبة لا تقل عن 2٪ في مختلف مهام التقييم. على وجه الخصوص، في مهام تصنيف ImageNet 100 وImageNet، تجاوزت دقة التصنيف (Top 1 وTop 5) لأفضل الطرق الحالية بدون إشراف. وفي السياقات شبه الإشرافية، ارتفعت دقة التصنيف (Top 1 وTop 5) بأكثر من 3٪ و2٪ على التوالي. كما حققت الاستراتيجية مكاسب ثابتة في مهام الكشف عن الأهداف والفصل العنقودي للمثيلات، وأدت إلى زيادة الأداء بأكثر من 5٪ في مهام التعلم القليل العينة مثل Omniglot وminiImageNet وCIFAR FS. النتائج تشير إلى أن استراتيجية أخذ العينات هذه تحد من الروابط الزائفة وتعزز التعلم السببي، مما يساهم في تحسين قدرة النماذج على التعميم خارج التوزيع. وقد قبلت هذه الدراسة في المؤتمر الدولي الرائد في مجال التعلم الآلي، International Conference on Machine Learning (ICML-25)، وهو ما يعتبر اعترافًا دوليًا بأهميتها ومكانتها في هذا المجال. يعد هذا التقدم خطوة مهمة نحو تحقيق أنظمة تعلم آلي أكثر فعالية وموثوقية، قادرة على التعامل بشكل أفضل مع التنوع الكبير في البيانات الواقعية التي قد لا تكون مشابهة تمامًا للبيانات المستخدمة في التدريب.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

Command Palette

استراتيجية جديدة للعينة الصغيرة من البيانات تُحسّن أداء نماذج التعلم الذاتي تحت الإشراف في التعامل مع المهام الخارجية للتوزيع💪🔍🚀

الروابط ذات الصلة

Command Palette

استراتيجية جديدة للعينة الصغيرة من البيانات تُحسّن أداء نماذج التعلم الذاتي تحت الإشراف في التعامل مع المهام الخارجية للتوزيع💪🔍🚀

الروابط ذات الصلة

Command Palette

استراتيجية جديدة للعينة الصغيرة من البيانات تُحسّن أداء نماذج التعلم الذاتي تحت الإشراف في التعامل مع المهام الخارجية للتوزيع💪🔍🚀

الروابط ذات الصلة