اختيار وتداول: نحو تداول الزوج الموحد باستخدام التعلم التعزيزي الهرمي

التجارة المزدوجة هي واحدة من أكثر استراتيجيات التحكيم الإحصائي فعالية، والتي تسعى لتحقيق ربح محايد من خلال التحوط بين زوجين من الأصول المختارة. تحلل الأساليب الحالية هذه المهمة عادةً إلى خطوتين منفصلتين: اختيار الزوج والتجارة. ومع ذلك، فإن فصل هذين المهمتين المرتبطتين ارتباطًا وثيقًا يمكن أن يعيق نقل المعلومات ويؤدي إلى أداء عام محدود. بالنسبة لاختيار الزوج، فإن تجاهل أداء التجارة يؤدي إلى اختيار أصول خاطئة ذات حركات سعر غير ذات صلة، بينما يمكن للوكيل الذي تم تدريبه على التجارة أن يتكيف بشكل مفرط مع الأصول المختارة دون أي معلومات تاريخية عن الأصول الأخرى. لمعالجة هذا الأمر، نقترح في هذا البحث نموذجًا لإجراء التجارة المزدوجة تلقائيًا كمهمة موحدة بدلاً من أنبوب ذو خطوتين. قمنا بتصميم إطار تعزيز تعلم متدرج لتعلم وتحسين المهمتين الفرعيتين معًا. سيقوم سياسة المستوى العالي باختيار زوجين من الأصول من جميع الاحتمالات، ثم تقوم سياسة المستوى المنخفض بتنفيذ سلسلة من إجراءات التداول. تظهر النتائج التجريبية على بيانات الأسهم الحقيقية فعالية طريقة بحثنا في التجارة المزدوجة مقارنة بالأساليب الحالية لاختيار الزوج والتداول.