HyperAI

أداة التعرف على الكلام عبر الإنترنت Whisper Web

مقدمة

Whisper هو نموذج تحويل الكلام إلى نص والذي قامت OpenAI بفتح مصدره في عام 2023. وقد حظي تأثيره التوليدي بإشادة واسعة النطاق. يعتمد هذا البرنامج التعليمي على مشروع مفتوح المصدر Whisper Web على GitHub ويقوم بتشغيل Whisper مباشرة في المتصفح.

يستخدم Whisper تقنية التعلم الآلي للتعرف على الكلام ويمكن تسريعه باستخدام WebGPU. إنه يدعم تحميل الملفات الصوتية عبر الإنترنت/المحلية والتسجيل الفوري بأكثر من 100 لغة. يمكن تصدير النص المعترف به بتنسيقات ملفات TXT وJSON، ويمكن أيضًا ترجمته مباشرة إلى اللغة الإنجليزية.

عرض التأثير

طريقة التشغيل (تستغرق حوالي 10 ثوانٍ للتهيئة بعد بدء تشغيل الحاوية، ثم تنفيذ العمليات التالية)

1. بعد استنساخ الحاوية وبدء تشغيلها، انسخ واجهة برمجة التطبيقات إلى متصفحك

2. احصل على ملفات صوتية عن طريق التحميل عبر الإنترنت/المحلي أو التسجيل الفوري

3. حدد النموذج وفقًا لاحتياجاتك

4. بعد الانتهاء من اختيار النموذج، قم بإنشاء النتائج مباشرة