HyperAIHyperAI
منذ 17 أيام

تَمثيل البيانات باستخدام t-SNE

{Geoffrey Hinton, Laurens van der Maaten}
تَمثيل البيانات باستخدام t-SNE
الملخص

نقدّم تقنية جديدة تُسمّى "t-SNE" تُستخدم لتمثيل البيانات عالية الأبعاد من خلال إعطاء كل نقطة بيانات موضعًا في خريطة ثنائية أو ثلاثية الأبعاد. تُعد هذه التقنية تنويعًا لتقنية التضمين الجار العشوائي (Stochastic Neighbor Embedding) التي طوّرها هينتون وروييس (2002)، وهي أكثر سهولة في التحسين، وتُنتج تمثيلات مرئية أفضل بشكل ملحوظ من خلال تقليل احتمالية تجمع النقاط معًا في مركز الخريطة. يُظهر t-SNE أداءً أفضل من التقنيات الحالية في إنشاء خريطة واحدة تكشف البنية على مقاييس متعددة. وهذا أمر بالغ الأهمية بالنسبة للبيانات عالية الأبعاد التي تقع على عدة أسطح منخفضة الأبعاد مختلفة ولكن مرتبطة ببعضها، مثل صور الكائنات من فئات متعددة تُرى من زوايا متعددة. ولتمثيل البنية في مجموعات بيانات ضخمة جدًا، نُظهر كيف يمكن لـ t-SNE استخدام المشي العشوائي على الرسوم البيانية للجوار لتمكين البنية الضمنية لجميع البيانات من التأثير على طريقة عرض مجموعة جزئية من البيانات. ونُظهر أداء t-SNE على مجموعة واسعة من مجموعات البيانات، ونقارنه بعدد من تقنيات التمثيل غير المعلمية الأخرى، بما في ذلك تخطيط سامون (Sammon mapping)، وآيزوماب (Isomap)، والتضمين الخطي المحلي (Locally Linear Embedding). وقد أظهرت التمثيلات المرئية التي تنتجها t-SNE تفوقًا ملحوظًا على تلك الناتجة عن التقنيات الأخرى في معظم مجموعات البيانات.

تَمثيل البيانات باستخدام t-SNE | أحدث الأوراق البحثية | HyperAI