HyperAIHyperAI

Command Palette

Search for a command to run...

كيف ساهم الذكاء الاصطناعي في تمكين الترجمة الصوتية في Google Meet

أصبحت ميزة الترجمة الصوتية الفورية في Google Meet ممكنة بفضل تقدّم كبير في تقنيات الذكاء الاصطناعي، بقيادة فريق هندسة الصوت بقيادة فريدريك، الذي يرى أن التحول الجذري بدأ قبل عامين عندما بدأت الفريق العمل على تطوير ترجمة صوتية مباشرة. في ذلك الوقت، كانت النماذج المتاحة قادرة فقط على الترجمة المتأخرة، غير مناسبة للمحادثات الحية. لكن الفريق كان واثقًا من إمكانية تحقيق الترجمة الفورية، ف collaborated مع فريق Google DeepMind، مما أدى إلى تقدم متسارع لم يكن متوقعًا في البداية. ما جعل التحول ممكنًا هو الانتقال من النموذج التقليدي المتعدد الخطوات — الذي يحول الصوت إلى نص، ثم يترجم النص، ثم يعيد تحويله إلى صوت — إلى نموذج "أحادي الخطوة" (one-shot) يُعالج الصوت مباشرة ويُنتج صوتًا مترجمًا في وقت قصير جدًا. وفقًا لهويب، المسؤول عن إدارة المنتجات المتعلقة بجودة الصوت، فإن هذا التحوّل أزال التأخير الكبير الذي كان يبلغ 10 إلى 20 ثانية، وجعل الترجمة أقرب إلى الطريقة التي يتعامل بها المترجم البشري مع المحادثات الحية. ووجد الفريق أن المدة المثالية تتراوح بين ثانيتين وثلاث ثوانٍ، حيث أصبحت الترجمة سريعة بما يكفي لتمكّن من محادثة طبيعية دون توقف. لكن التحدي لم يكن مجرد التقليل من التأخير، بل أيضًا الحفاظ على الجودة في ظل ظروف مختلفة، مثل الأصوات المختلفة، الضوضاء الخلفية، أو جودة الشبكة. لذا، عمل الفريق مع خبراء لغويين ومتخصصين في اللغات لفهم الفروق الدقيقة بين التراكيب اللغوية، وخصوصًا في اللغات التي تتشابه جذريًا مثل الإسبانية، الإيطالية، البرتغالية، والفرنسية، بينما واجهت اللغات مثل الألمانية تحديات أكبر بسبب اختلافات في القواعد والتعابير الشعبية. حتى الآن، تُترجم بعض العبارات حرفياً، ما يؤدي أحيانًا إلى سوء فهم مضحّك، لكن الفريق يتوقع أن تُحسّن النماذج الحديثة، خاصة تلك القائمة على نماذج لغوية كبيرة (LLMs)، من قدرة الترجمة على التقاط النبرة، والسخرية، والتعابير غير الحرفية. اليوم، يضم المشروع جهودًا مشتركة من فرق متعددة داخل جوجل، بما في ذلك فرق Pixel وCloud وChrome، ما يعكس التزام الشركة بتحقيق تجربة تواصل عالمية وسلسة. الترجمة الفورية في Meet لم تعد مجرد تجربة تقنية، بل أصبحت وسيلة فعّالة لربط الناس من خلفيات لغوية مختلفة، وتمكينهم من التحدث بثقة وانسيابية، وكأنهم يتحدثون بلغة واحدة.

الروابط ذات الصلة

كيف ساهم الذكاء الاصطناعي في تمكين الترجمة الصوتية في Google Meet | القصص الشائعة | HyperAI