HyperAI

التعلم المتعدد

التعلم المتعددإنها طريقة أساسية في التعرف على الأنماط، والتي تعتمد على البحث عن جوهر الأشياء في الظواهر الملاحظة والعثور على القوانين الداخلية التي تولد البيانات.

يمكن تقسيم التعلم المتعدد إلى نوعين: خوارزميات التعلم المتعدد الخطي وخوارزميات التعلم المتعدد غير الخطي. تتضمن خوارزميات التعلم المتعدد غير الخطي خرائط متساوية الأبعاد، وخرائط لابلاس الذاتية، والتضمين الخطي المحلي. تتضمن الأساليب الخطية تحليل المكونات الأساسية والقياس متعدد الأبعاد.

رسم الخرائط المتساوية القياس

الهدف من Isomap هو العثور على التضمين منخفض الأبعاد المقابل لمتعدد الشعب عالي الأبعاد معين، بحيث يمكن الحفاظ على بنية الجوار بين نقاط البيانات على متعدد الشعب عالي الأبعاد في التضمين منخفض الأبعاد. يستخدم Isomap المسافة الجيوديسية في الهندسة التفاضلية لحساب المسافة بين نقاط البيانات على متعددات الأبعاد العالية.

ميزة:

  • تعتمد عملية الحل على مشاكل القيمة الذاتية والمتجه الذاتي في الجبر الخطي، مما يضمن قوة النتائج وكفاءتها العالمية؛
  • يمكن استخدام التباين المتبقي لتحديد البعد الأساسي للتضمين المنخفض الأبعاد الأساسي.
  • تتطلب طريقة Isomap تحديد معلمة واحدة فقط أثناء الحساب (معلمة الجوار k أو نصف قطر الجوار e).

خريطة لابلاس الذاتية

تستخدم خريطة لابلاس الذاتية رسمًا بيانيًا مرجحًا غير موجه لوصف متعدد الشعب، ثم تستخدم تضمين الرسم البياني للعثور على تمثيل منخفض الأبعاد. إنه الأسرع، لكن تأثيره غير مرضي نسبيًا.

التضمين الخطي محليًا

يعد التضمين الخطي المحلي علامة فارقة في تقليل الأبعاد غير الخطية، ويمكن تلخيص خوارزميته في ثلاث خطوات:

  • العثور على أقرب k جيران لكل نقطة عينة؛
  • يتم حساب مصفوفة وزن إعادة البناء المحلية لكل نقطة عينة من النقاط المجاورة لنقطة العينة؛
  • يتم حساب قيمة خرج نقطة العينة بناءً على مصفوفة وزن إعادة البناء المحلية لنقطة العينة ونقاطها المجاورة.

تحليل المكونات الرئيسية

يتم الحصول على المتغيرات الجديدة عن طريق الجمع الخطي للمتغيرات الأصلية. إن التباين بين هذه المتغيرات هو الأكبر. نظرًا لأن الفرق بين المتغيرات الأصلية للبيانات قد لا يكون كبيرًا والأوصاف متشابهة، فإن الكفاءة تكون منخفضة.

القياس متعدد الأبعاد

يهدف تحليل القياس متعدد الأبعاد إلى التعبير عن البيانات المرصودة بأبعاد أقل، ولكنه يستخدم التشابه بين العينات المزدوجة لبناء مساحة مناسبة منخفضة الأبعاد بحيث يكون التشابه بين العينات والمساحة عالية الأبعاد متسقًا قدر الإمكان.

تتكون طريقة تحليل القياس متعدد الأبعاد من خمسة عناصر رئيسية وهي: الموضوع، والهدف، والمعيار، ووزن المعيار، ووزن الموضوع، على النحو التالي:

  • الكائن: الكائن الذي يتم تقييمه. ويمكن اعتبارها عدة فئات ليتم تصنيفها.
  • الموضوع: الوحدة التي تقوم بتقييم الكائن. إنها بيانات التدريب.
  • المعايير: هي معايير يحددها الباحث بنفسه وفقا لغرض البحث وتستخدم لتقييم جودة الموضوع.
  • وزن المعايير: بعد تحديد أهمية المعايير، يقوم الموضوع بتعيين قيمة وزن لكل معيار.
  • وزن الموضوع: بعد وزن أهمية المعايير، يقوم الباحث بإعطاء قيمة وزن للموضوع.