HyperAIHyperAI

Command Palette

Search for a command to run...

من وراء الكواليس: كيف جعلت ميتا نقلة لغوية حية في نظاراتها الذكية ممكنة

في مؤتمر Connect 2024، أذهل مارك زوكربيرغ العالم بعرضه الحي لتقنية الترجمة الفورية على نظارات الذكاء الاصطناعي من ميتا، مُقدّمًا نظرة واقعية على حلم الترجمة الفورية التي طالما راودت الخيال العلمي. اليوم، أصبحت هذه الميزة متاحة على مجموعة من النظارات الذكية، بما في ذلك Ray-Ban Meta، Oakley Meta Vanguard، Oakley Meta HSTN، وMeta Ray-Ban Display، مع دعم لغات مثل الإنجليزية، الفرنسية، الألمانية، الإيطالية، البرتغالية، والإسبانية على النماذج الأولى، والإنجليزية، الفرنسية، الإيطالية، والإسبانية على النموذج الأخير. بدأت الفكرة كمُعَرَّض تجريبي لنموذج غير مُعلن من نظارات Meta Ray-Ban Display، لكن الفريق سرعان ما اكتشف أن نظارات Ray-Ban Meta الجاهزة للسوق كانت المختبر المثالي. بفضل مصفوفة خمسة ميكروفونات وتقنية توجيه الصوت (beamforming)، تمكّن النظارات من تمييز صوت الحامل عن شريك المحادثة، مما عزز دقة الترجمة. وباستخدام مكبرات الصوت المدمجة بدل الشاشة، تم عرض الترجمة مباشرةً كصوت، في زمن قريب من الزمن الفعلي، مع معالجة كل شيء داخل النظارة دون الحاجة إلى اتصال بالإنترنت. التصميم كان بُني على فهم عميق لاحتياجات المستخدم، خاصة في السياقات الحياتية مثل السفر، حيث قد تكون الاتصالات ضعيفة. لذلك، تم تطوير النظام ليُمكن تحميله مسبقًا وتشغيله في وضع الطائرة. التحدي الأكبر كان تضمين نموذج ذكاء اصطناعي قوي داخل جهاز صغير، مع الحفاظ على أداء مقبول وتجنب التسخين. كما تطلب الأمر تقليل التأخير من أكثر من 5 ثوانٍ إلى 2.7 ثانية فقط، بفضل تطوير نموذج يُعالج الترجمة والصوت بشكل تدفقي، دون انتظار اكتمال الجملة. العمل لم يكن سهلاً. لا يوجد تسجيل مركزي للبيانات داخل الجهاز، ما صعّب عملية التحسين والاختبار. لذلك، اعتمد الفريق على اختبارات مستمرة ومتكررة. ورغم أن الميزة لا تزال قيد التطوير، فإن التفاعل مع المستخدمين في برنامج الوصول المبكر كان إيجابياً، حيث استخدمها الناس للتحدث مع العائلة، والتنقل في دول جديدة، والمشاركة في مؤتمرات دولية. ما يميز هذه التقنية هو أنها لا تقطع المستخدم عن بيئته، كما تفعل السماعات التقليدية، بل تستخدم مكبرات صوت مفتوحة تسمح بالاستماع إلى الترجمة دون فقدان الوعي بالمكان. كما يُعرض نص الترجمة الفورية بلغتين في تطبيق Meta AI، مما يساعد الشريك في المحادثة على متابعة الحوار. الفرق الذي طوّر هذه التقنية يُعدّ من أقوى الفرق التي عملت على منتجات ميتا، وفقاً لباحثين ومهندسين شاركوا في المشروع. فهم لم يركزوا فقط على التكنولوجيا، بل على التأثير البشري: فهم يتحدثون لغات متعددة، ويعرفون قيمة التواصل مع الأجداد أو الأصدقاء في بيئة متعددة اللغات. الهدف ليس مجرد الترجمة، بل تمكين الإنسان من فهم أي لغة في أي مكان، في أي وقت. مع استمرار التطور، ستُضاف لغات جديدة، لكن كل لغة تتطلب تدريباً خاصاً لكل نموذج من النظارات، ما يجعل التوسع عملية معقدة. ومع ذلك، فإن الفريق يواصل العمل لتحسين الدقة والسرعة، وتوسيع نطاق اللغة، مستهدفًا عالمًا أكثر ترابطًا، حيث لا تكون اللغة حاجزًا أمام التواصل الإنساني.

الروابط ذات الصلة