يوتيوب يُطلق أدوات ذكاء اصطناعي لدعم مبدعي المحتوى وتعزيز البودكاست
في حدث ميد أون يوتيوب في نيويورك كشف نيل موهان رئيس يوتيوب عن مجموعة جديدة من الأدوات المدعومة بالذكاء الاصطناعي التي تهدف إلى تعزيز موقع المنصة كقائد في مجال البودكاست والفيديو القصير. تأتي هذه التطورات في سياق منافسة متصاعدة مع منصات مثل سبوتيفاي وتيك توك ونيتفليكس التي تسعى لدخول سوق البودكاست المرئي. يركز الاهتمام الرئيسي على تمكين المبدعين من محتوى الصوت فقط من إنشاء محتوى مرئي بسهولة باستخدام الذكاء الاصطناعي، مما يقلل الحواجز أمام المبدعين غير المتمرسين في إنتاج الفيديو. تُستخدم تقنية فيو من جوجل لتوليد مشاهد قصيرة مدتها 30 إلى 60 ثانية من نصوص البودكاست الصوتية، وتُعد هذه الأدوات متاحة حالياً لعدد محدود من المبدعين في الولايات المتحدة، مع خطط للتوسع في 2026. الهدف من هذه الميزة هو تمكين المبدعين الذين يخشون التعامل مع الكاميرات أو يجدون صعوبة في تحويل حديثهم الصوتي إلى محتوى مرئي من الانخراط في منصة يوتيوب التي تعتمد على الفيديو. وفقاً لتاي جاي فوولر من يوتيوب، فإن هذه الأداة تساعد المبدعين على "تجربة الدخول بسهولة" دون الحاجة إلى استثمار كبير في الإنتاج. كما أعلنت يوتيوب عن ميزة جديدة لتحويل مقاطع البودكاست المرئية إلى مقاطع قصيرة مخصصة لـ Shorts، باستخدام الذكاء الاصطناعي لاقتراح وتقليم اللحظات المميزة، وهي ميزة ستُطرح في الأشهر المقبلة. يوتيوب يمتلك ميزة تنافسية واضحة في هذا المجال كمنصة فيديو طبيعية تمتلك نموذج دخل مشترك مع المبدعين، وتحظى بقاعدة جماهيرية ضخمة. ففي يوليو 2025 بلغ استهلاك المستخدمين لبودكاست يوتيوب أكثر من 100 مليون ساعة يومياً، و30% من هذه الساعات تبدأ كبث مباشر أو عرض أولي. كما أن 44% من جمهور البودكاست الجديد يبدأون من يوتيوب، وفقاً لتقرير من كومولوس ميديا. وتُظهر بيانات من مورنينغ كونسالت أن نسبة من يفضلون البودكاست المرئي ارتفعت من 32% في أكتوبر 2022 إلى 42% في أغسطس 2024، ما يعزز الحاجة إلى محتوى مرئي. إلى جانب أدوات البودكاست، كشف يوتيوب عن تحديثات متطورة في ميزة Shorts باستخدام نسخة معدلة من نموذج فيو 3 تُسمى فيو 3 فاست التي تُنتج مقاطع بجودة 480 بيكسل بسرعة عالية وتسمح بإضافة صوت لأول مرة. كما تتيح التقنية نقل الحركة من فيديو إلى صورة ثابتة، مثل جعل شخص في صورة يرقص كما في مقطع فيديو آخر، وتطبيق أنماط فنية مختلفة مثل الفن البوب أو الأصلامي. كما يمكن إضافة كائنات أو شخصيات باستخدام وصف نصي. أُعلن أيضاً عن أداة جديدة تُسمى "التحويل من كلام إلى أغنية" التي تستخدم نموذج ليريا 2 من جوجل لتحويل جمل من فيديو إلى موسيقى قابلة للتعديل حسب النمط مثل "هادئ" أو "رقص" أو "ممتع". وستُختبر هذه الميزة قريباً في الولايات المتحدة. كما تُقدّم ميزة "التحرير بالذكاء الاصطناعي" التي تحوّل اللقطات الخام إلى نسخة أولية تضم تراكيب موسيقية وانتقالات وتعليق صوتي تفاعل مع المحتوى، بدعم من اللغتين الإنجليزية والهندية. جميع هذه الأدوات تُطرح تدريجياً في الولايات المتحدة ودول أخرى، مع خطط للتوسع لاحقاً. تُظهر هذه الخطوات التزام يوتيوب بتحويل منصته إلى بيئة إبداعية شاملة تدمج الصوت والفيديو والذكاء الاصطناعي لتعزيز تجربة المبدع والمستخدم على حد سواء.
