آلة تسيتلين الموزونة: تمثيلات مُضمنة باستخدام شرطيات موزونة

آلة تسيتلين (TM) هي آلية قابلة للتفسير للتعرف على الأنماط، تقوم ببناء عبارات منطقية متعددة من البيانات. تُمثّل هذه العبارات أنماطًا متكررة ذات قدرة تمييزية عالية، وتوفر قدرة تعبيرية متزايدة مع كل عبارة إضافية. ومع ذلك، فإن الزيادة الناتجة في الدقة تأتي على حساب نمو خطي في وقت المعالجة واستهلاك الذاكرة. في هذه الورقة، نقدّم آلة تسيتلين الموزونة (WTM)، التي تقلل من وقت المعالجة واستهلاك الذاكرة من خلال تخصيص أوزان للعبارات. تسمح الأوزان ذات القيم الحقيقية بتعويض عدة عبارات بعبارة واحدة، وتدعم ضبط التأثير الدقيق لكل عبارة بشكل دقيق. كما أن مخططنا الجديد يتعلم بشكل متزامن كل من تركيب العبارات وأوزانها. علاوة على ذلك، نعزز كفاءة التدريب من خلال استبدال $k$ تجارب برنولي ذات احتمال نجاح $p$ بعينة موحدة بحجم متوسط يساوي $p k$، حيث يتم استخراج الحجم من توزيع ثنائي الحدين. في تقييمنا التجريبي، حققت WTM نفس دقة آلة تسيتلين (TM) على مجموعات بيانات MNIST وIMDb وConnect-4، مع الحاجة فقط إلى $\frac{1}{4}$ و$\frac{1}{3}$ و$\frac{1}{50}$ من عدد العبارات على التوالي. وباستخدام نفس عدد العبارات، تفوقت WTM على TM، حيث حققت دقة اختبار قصوى بلغت على التوالي $98.63\%$ و$90.37\%$ و$87.91\%$. وأخيرًا، قلّل مخطط العينة الجديد لدينا من وقت إنشاء العينات بمعامل قدره $7$.