HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 17 أيام
الترجمة

ترجمة صوتية بـ جي إم تي 3.5

أعلنت شركة غوغل عن إطلاق نموذج غيميني 3.5 لايف ترانسليت الجديد للترجمة الصوتية المباشرة، في خطوة تمثل تطوراً تقنياً ملحوظاً في معالجة اللغات عبر المنصات الرقمية. بدأ مشروع الترجمة الآلية في الشركة قبل عقدين من الزمان كإجراء تجريبي في تعلم الآلة، ووصل اليوم إلى معالجة أكثر من تريليون كلمة شهرياً لمليارات المستخدمين حول العالم عبر خدماتها المتعددة. يتميز النموذج الجديد بقدرته على الكشف التلقائي عن أكثر من سبعين لغة، وتوليد كلام مترجم بدقة مع الحفاظ على نبرة المتحدث وسرعة نطقه وإيقاعه الصوتي. وعلى عكس الأنظمة التقليدية التي تعتمد على الانتظار حتى يفرغ المتحدث من كلامه، يعمل النظام بنمط دفق مستمر، مما يحقق توازناً دقيقاً بين جودة السياق الزمني ووقت الاستجابة الفوري. ويحافظ التطبيق على تأخير بسيط يبلغ بضعة ثوانٍ فقط عن المتحدث الأصلي، لضمان تدفق صوتي طبيعي خالٍ من التوقفات المزعجة. من الناحية الهندسية، يعالج النموذج الصوت الوارد بشكل لحظي دون حاجة إلى تكوينات يدوية، مما يدعم التفاعلات متعددة اللغات بكفاءة عالية. كما تم تعزيز مرونة الخوارزمية ضد الضوضاء المحيطة، لتمكين التطبيقات من العمل بثبات في الأماكن الصاخبة أو غير المستقرة. ويوفر هذا الإصدار واجهات برمجية مخصصة للمطورين، لدمج الترجمة الفورية في المكالمات المؤسسية والاجتماعات الافتراضية والفصول التعليمية والبث المباشر. تم بدء نشر النموذج على نطاق واسع عبر منتجات غوغل كافة اعتباراً من اليوم. ويؤكد خبراء قطاع التقنية أن هذا التحديث يعكس نضج نماذج الذكاء الاصطناعي التوليدي في محاكاة التفاعل البشري مع اللغات، مما يعزز آفاق التواصل العالمي عن بُعد ويرفع المعايير المعتمدة في بيئات الأعمال والتعليم والترفيه الرقمي.

الروابط ذات الصلة

ترجمة صوتية بـ جي إم تي 3.5 | القصص الشائعة | HyperAI