نسبة الربح
معدل الربحيشير عادةً إلى معدل اكتساب المعلومات، والذي يمثل نسبة معلومات العقدة إلى مقياس معلومات تقسيم العقدة. يتم استخدام معدل الربح عادةً كأحد طرق اختيار السمات. والطريقتان الشائعتان الأخريان هما الحصول على المعلومات ومؤشر جيني.
صيغة معدل الربح هي كما يلي:
عادةً، يتم اعتبار السمة ذات معدل الربح الأكبر هي أفضل سمة تقسيم. إذا كان هناك عدد كبير جدًا من قيم السمة الواحدة، فسيصبح SplitInfoR(D) أكبر، مما سيؤدي إلى GainRatio(R) أصغر. ومع ذلك، فإن معدل الربح له عيوب أيضًا. إذا كان SplitInfo(D) يساوي 0، فلا يوجد معنى للحساب؛ وعندما تتجه SplitInfo(D) إلى 0، تصبح قيمة GainRatio(R) غير موثوقة. الإجراء التحسيني هو إضافة التنعيم إلى المقام. هنا، تتم إضافة القيمة المتوسطة لجميع المعلومات المنقسمة: