HyperAIHyperAI

Command Palette

Search for a command to run...

نهج متعدد الوسائط لتصنيف صور VCE المنظارية باستخدام BiomedCLIP-PubMedBERT

Nagarajan Ganapathy Podakanti Satyajith Chary Teja Venkata Ramana Kumar Pithani Pavan Kavati Arun Kumar S

الملخص

تقدم هذه الورقة منهجًا متقدمًا لضبط النموذج الدقيق BiomedCLIP PubMedBERT، وهو نموذج متعدد الوسائط، لتصنيف التشوهات في إطارات التنظير بالكبسولة (VCE)، بهدف تعزيز كفاءة التشخيص في الرعاية الصحية الهضمية. من خلال دمج نموذج اللغة PubMedBERT مع نموذج التحويل البصري (Vision Transformer - ViT) لمعالجة الصور التنظيرية، يتم تصنيف الصور إلى عشر فئات محددة: تمدد الأوعية الدموية، النزيف، التقرحات، الاحمرار، الأجسام الغريبة، تمدد الليمف، الورم، القرحة، الديدان، والحالة الطبيعية. يشمل نهجنا معالجة الصور مسبقًا وضبط النموذج BiomedCLIP بدقة لاستخراج تمثيلات عالية الجودة لكل من المدخلات البصرية والنصية، مع محاذاة هذه التمثيلات من خلال تقييم التشابه لغرض التصنيف. تُظهر مقاييس الأداء، بما في ذلك الدقة، والدقة، والاسترجاع، ودقة F1، قدرة النموذج القوية على تحديد التشوهات بدقة في إطارات التنظير، مما يوحي بإمكانية استخدامه العملي في التشخيص السريري.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp