شبكة تسجيل صور متحركة متكررة ذات انتباه متبادل

التسجيل القابل للتشوه للصور، الذي يُقدّر التحويل المكاني بين صور مختلفة، يُعد مهمة مهمة في مجال التصوير الطبي. وقد استخدمت العديد من الدراسات السابقة طرقًا تعتمد على التعلّم لتسجيل متعدد المراحل، بهدف تحسين الأداء في التسجيل ثلاثي الأبعاد للصور. ومع ذلك، فإن أداء النهج المتعدد المراحل محدود بحجم مجال الاستقبال (receptive field)، حيث لا تحدث حركات معقدة في مقياس مكاني واحد. نقترح شبكة تسجيل جديدة تجمع بين بنية الشبكة التكرارية (recursive network architecture) وآلية الانتباه المتبادل (mutual attention mechanism) للتغلب على هذه القيود. مقارنةً بالطرق المتقدمة القائمة على التعلم العميق، تحقق شبكتنا التي تعتمد على البنية التكرارية أعلى دقة على مجموعة بيانات التصوير المقطعي المحوسب للرئة (مقياس دايسي 92% ومسافة السطح المتوسطة 3.8 مم للرئتين)، وأحد أكثر النتائج دقةً على مجموعة بيانات التصوير المقطعي المحوسب للبطن التي تحتوي على 9 أعضاء ب أحجام مختلفة (مقياس دايسي 55% ومسافة السطح المتوسطة 7.8 مم). كما أظهرنا أن إضافة ثلاث شبكات تكرارية كافية لتحقيق أفضل النتائج الحالية دون زيادة كبيرة في زمن الاستدلال.