التعرف التلقائي على الإشارات في الجراحة المعاونة بالروبوت باستخدام التعلم التعزيزي والبحث الشجري

التعرف التلقائي على الإيماءات الجراحية هو من الأساسيات لتحسين الذكاء في الجراحة المعاونة بالروبوت، مثل تنفيذ مهام معقدة لمراقبة الجراحة وتقييم المهارات. ومع ذلك، فإن الطرق الحالية تتعامل مع كل إطار بشكل منفصل وتنتج النتائج دون اعتبار فعال للمعلومات المستقبلية. في هذا البحث، نقترح إطارًا يستند إلى التعلم التعزيزي والبحث الشجري لتقسيم وإصناف الإيماءات الجراحية بشكل مشترك. يتم تدريب وكيل على تقسيم وإصناف الفيديو الجراحي بطريقة تشبه البشر، حيث يتم إعادة النظر في القرارات المباشرة بواسطة البحث الشجري بشكل مناسب. يجمع خوارزمية البحث الشجري المقترحة لدينا النواتج من شبكتين عصبيتين مصممتين، وهما شبكة السياسة وشبكة القيمة (Policy and Value Network). بفضل دمج المعلومات المكملة من نماذج مختلفة، يتمكن إطارنا من تحقيق أداء أفضل من الطرق الأساسية التي تستخدم إحدى الشبكتين العصبيتين. لتقييم شامل، أثبتت الطريقة التي طورناها باستمرار تفوقها على الطرق الموجودة في مهمة الخياطة ضمن مجموعة بيانات JIGSAWS من حيث الدقة ودرجة التعديل ونسبة F1. يسلط بحثنا الضوء على استخدام البحث الشجري لتحسين الأفعال في إطار التعلم التعزيزي للتطبيقات الروبوتية الجراحية.