HyperAIHyperAI
Back to Headlines

Speechmatics تُحدث رقماً قياسياً في تحويل الكلام الطبي إلى نص بدقة 93%

منذ 10 أيام

شركة Speechmatics تُعلن عن تحقيقها رقماً قياسياً في دقة تحويل الكلام إلى نص في المجال الطبي، بوصول دقة النموذج الجديد إلى 93% في البيئات الواقعية، متفوقةً على منافسيها بـ50% أقل في أخطاء المصطلحات الطبية و17% أقل في الأخطاء الكلامية العامة. تم تطوير النموذج الجديد خصيصاً لمواكبة التعقيد والسرعة المطلوبة في ممارسة الرعاية الصحية، مع دعم موسّع للمصطلحات الطبية والدوائية، وتقنيات معالجة صوتية قادرة على التعرف على الأصوات بغض النظر عن اللهجات، بالإضافة إلى تقسيم المتكلمين في الوقت الفعلي (speaker diarization)، حتى في الظروف الصعبة مثل الضوضاء الخلفية أو التدخلات المفاجئة. يتميز النموذج بقدرته على التعامل مع المحادثات متعددة المتحدثين بسرعة، مما يُسهم في إنتاج ملاحظات طبية أنظف، وتقليل الحاجة إلى التصحيح اليدوي، وضمان سجل دقيق لكل زيارة طبية. وفقاً لكيتي ويجدال، المديرة التنفيذية للشركة، فإن الهدف الأساسي هو بناء تقنية صوتية يمكن للأطباء والفريق الطبي الاعتماد عليها في بيئة العمل الواقعية، حيث "كل كلمة دقيقة تُعيد وقتاً للمرضى وتخفف من إرهاق الأطباء، مما يسمح للفرق بالتركيز على ما يهم حقاً". النموذج متاح في نموذجين: معالجة جماعية (batch) وعملية في الزمن الفعلي (real-time)، ما يضمن أداءً عالياً وثابتاً في سير العمل التي تعتمد على التسجيل الصوتي أو أدوات التدوين الآلي (AI-Scribe). ويأتي هذا التطور في سياق تحول سريع في القطاع الصحي نحو التوثيق البيئي (ambient documentation) على نطاق واسع، حيث يُعتمد على التقنيات الصوتية لتوثيق المحادثات الطبية تلقائياً دون تدخل مكثف من الموظفين. يُعدّ التعرف على المصطلحات الطبية الدقيقة من أهم التحديات في هذا المجال، ولهذا فإن معدل خطأ الكلمات (Keyword Error Rate) يُعتبر مؤشراً حاسماً. وبلغت دقة النموذج الجديد في هذا المجال 4% فقط، وهو ما يفوق جميع الأنظمة المُختبرة، بما يُضعِف من خطر فقدان معلومات حيوية مثل التشخيصات أو الجرعات أو المواعيد. وتم التحقق من هذه النتائج في اختبارات معيارية، حيث حظي النموذج بتفوّق ملحوظ على أبرز المنافسين (تتراوح دقتهم بين 74% و91%، مع أفضل منافس عند 91%). ما يميّز Speechmatics هو تصميم نماذجها من البداية لتعمل في الزمن الفعلي، ما يعني أن الانتقال من التحويل المبني على الملفات إلى العمل اللحظي لا يُصاحَب بخسارة في الدقة، وهو ما يُعدّ ميزة نادرة في السوق. تُعدّ Speechmatics شركة رائدة في مجال التعرف على الكلام، وتوفر تقنيتها للعديد من القطاعات العالمية، من الرعاية الصحية إلى وسائل الإعلام وخدمات العملاء والأنظمة الصوتية الذكية. تدعم منصتها أكثر من 55 لغة، وتتكيف مع اللهجات المختلفة، وتمكّن من التعامل مع الكلام المتداخل بدقة عالية. مقرها الرئيسي في كامبريدج ولندن، وتُقدّم حلولاً قابلة للتضمين في الأنظمة الحالية، مع إمكانية التشغيل في السحابة أو على الأجهزة المحلية أو في بيئات الحافة (edge).

Related Links