MedGen: فتح الباب أمام إنشاء مقاطع الفيديو الطبية من خلال توسيع نطاق مقاطع الفيديو الطبية المُشَرَّحة بدقة

التطورات الحديثة في توليد الفيديو أظهرت تقدماً ملحوظاً في البيئات المفتوحة، ومع ذلك بقي توليد الفيديوهات الطبية مجالاً قليلاً ما تم استكشافه. تعتبر الفيديوهات الطبية حاسمة لتطبيقات مثل التدريب السريري، التعليم والمحاكاة، حيث تتطلب ليس فقط دقة بصرية عالية ولكن أيضاً دقة طبية صارمة. ومع ذلك، غالباً ما تنتج النماذج الحالية محتوى غير واقعي أو خاطئ عند تطبيقها على الدعوات الطبية (prompts)، وذلك بشكل كبير بسبب نقص البيانات ذات الجودة العالية والمقياس الكبير والمخصصة لمجال الرعاية الصحية. لمعالجة هذه الثغرة، نقدم MedVideoCap-55K، وهو أول مجموعة بيانات كبيرة ومتنوعة غنية بالتعليقات للفيديو الطبي. تتكون هذه المجموعة من أكثر من 55,000 مقطع فيديو مختار بعناية يغطي سيناريوهات طبية حقيقية من العالم، مما يوفر أساساً قوياً لتدريب نماذج توليد الفيديو الطبية العامة. بناءً على هذه المجموعة من البيانات، طورنا MedGen، والذي يحقق أفضل الأداء بين النماذج المفتوحة المصدر ويضاهي الأنظمة التجارية في العديد من المقاييس سواء على مستوى الجودة البصرية أو الدقة الطبية. نأمل أن تكون مجموعتنا من البيانات ونموذجنا موردًا قيمة وأن تسهم في تحفيز المزيد من البحث في مجال توليد الفيديو الطبي. يمكن الوصول إلى شفرتنا البرمجية ومجموعتنا من البيانات عبر الرابط: https://github.com/FreedomIntelligence/MedGen