تضمين الجار العشوائي لتوزيع T
T – تضمين الجوار العشوائي الموزعإنها طريقة تعلم آلي لتقليل الأبعاد ويمكن استخدامها لتحديد أنماط الارتباط. ميزتها الرئيسية هي أنها تحافظ على البنية المحلية. وهذا يعني أن النقاط ذات المسافات المتشابهة في مساحة البيانات عالية الأبعاد تظل متشابهة عند إسقاطها في أبعاد منخفضة.
ميزات T-SNE
في الفضاء منخفض الأبعاد، يمكن أن يؤدي استخدام توزيع t مع توزيع ذيل طويل أثقل إلى تجنب مشاكل الازدحام والتحسين.
ميزة التدرج T-SNE
- بالنسبة للنقط المختلفة، يتم استخدام مسافة أصغر لتوليد تدرج أكبر لصد النقاط؛
- هذا التنافر ليس لانهائيًا، لتجنب أن تكون النقاط المختلفة بعيدة جدًا عن بعضها البعض.
T-SNE ليس كافيا
- يتم استخدام T-SNE بشكل أساسي للتوضيح، لذا فإن أداءه ضعيف في جوانب أخرى، مثل تقليل الأبعاد في مجموعة الاختبار. نظرًا لعدم وجود جزء تقدير صريح، فلا يمكن تقليله بشكل مباشر على مجموعة الاختبار.
- تميل T-SNE إلى الحفاظ على الميزات المحلية. بالنسبة لمجموعات البيانات ذات الأبعاد الجوهرية العالية، فمن المستحيل تعيينها بالكامل في مساحة ثنائية أو ثلاثية الأبعاد.
- لا يحتوي T-SNE على حل مثالي فريد أو جزء تقدير. لإجراء تقدير، يجب عليك مراعاة تقليل الأبعاد ثم بناء نموذج مثل معادلة الانحدار.
- التدريب بطيء للغاية، ويتم تحسين العديد من الخوارزميات القائمة على الشجرة على T-SNE.