ORacle: نماذج لغوية بصرية كبيرة لنمذجة مجال OR الشاملة المدعومة بالمعرفة

كل يوم، تُجرى مئات العمليات الجراحية حول العالم، وكل عملية تُنفَّذ في بيئة مميزة من غرف العمليات (OR)، والتي تختلف ليس فقط من حيث التجهيزات، بل أيضًا من حيث الأفراد، والأدوات، والمعدات المستخدمة. إن هذا التنوع المتأصّل يشكل تحديًا كبيرًا لتحقيق فهم شامل لبيئة غرفة العمليات، حيث تتطلب النماذج القدرة على التعميم خارج نطاق بيانات التدريب الأصلية. ولتقليل هذه الفجوة، نقدّم ORacle، نموذجًا متقدمًا يعتمد على الرؤية واللغة، مصممًا لنمذجة بيئة غرفة العمليات بشكل شمولي، ويتميز بقدرات متعددة الزوايا والزمنية، ويمكنه الاستفادة من معرفة خارجية أثناء الاستدلال، مما يمكّنه من التكيّف مع سيناريوهات جراحية لم يُرَ قبل ذلك. ويُعزز هذا القدرة بشكل أكبر من خلال إطارنا الجديد للتكبير البيانات، الذي يُعدّد بشكل كبير مجموعة بيانات التدريب، مما يضمن كفاءة ORacle في توظيف المعرفة المقدمة بشكل فعّال. وفي الاختبارات الصارمة، سواء في إنشاء رسومات المشهد أو المهام اللاحقة على مجموعة بيانات 4D-OR، لا يُظهر ORacle أداءً يُعدّ من أفضل الأداءات الحالية، بل يفعل ذلك باستخدام كميات أقل من البيانات مقارنةً بالنماذج الحالية. علاوةً على ذلك، تُظهر مرونتها قدرتها على فهم مناظر جديدة، وحركات، وظواهر أدوات ومعدات لم تُرَ من قبل. ويُظهر هذا القدرة الكبيرة لـ ORacle على تعزيز قابلية التوسع والتكلفة المنخفضة لنمذجة بيئة غرفة العمليات، ويُفتح الطريق أمام تطورات مستقبلية في علوم بيانات الجراحة. وسوف نُطلق كودنا وبياناتنا بعد قبول البحث.