HyperAIHyperAI

Command Palette

Search for a command to run...

مُؤسسو جوجل يبنون بنية تحتية لفهم بيانات الفيديو في الشركات

شركة إنفينيميند، التي تأسستها زوجان من المُسَيِّرين السابقين في جوجل، أزا كاي (الرئيس التنفيذي) وهيراكو ياناغيتا (نائب الرئيس التنفيذي)، تسعى لتحويل الفيديو غير المستخدم إلى بيانات قابلة للتحليل والتفاعل، في خطوة تُعدّ استجابة لازدياد كميات البيانات المرئية التي تُجمَع دون استغلال فعّال. يعمل كلا المُؤسِّسين معًا في جوجل اليابان لقُرابة عقد من الزمن، حيث اكتشفا أن الشركات تمتلك ملايين الساعات من المحتوى المرئي — من مراقبة المتاجر إلى مكتبات البث التلفزيوني — لكنها تُخزن دون تحليل حقيقي، ما يُشكّل ما يُعرف بـ"البيانات المظلمة". في ظل تطور كبير في نماذج الذكاء الاصطناعي البصرية واللغوية بين 2021 و2023، أصبح من الممكن فهم الفيديو ليس فقط من حيث الكائنات في الإطارات، بل من حيث السياق، والتدفق السردي، والسببية، ما فتح الباب أمام حلول متطورة. تُعدّ إنفينيميند واحدة من أولى الشركات التي تركز على تطبيق هذه التقنيات في البيئة المؤسسية، بدلًا من المستخدمين العاديين. المنتج الأول للشركة، "تي في بولس"، طُرِح في اليابان في أبريل 2025، ويُحلّل محتوى التلفاز في الوقت الفعلي، لمساعدة شركات الإعلام والتجزئة على تتبع ظهور المنتجات، ووجود العلامات التجارية، ومشاعر العملاء، وتأثيرات العلاقات العامة. بعد نجاح تجارب تجريبية مع مُذيعات كبرى ووكالات إعلانية، أصبحت الشركة تمتلك عملاء مدفوعين، من بينهم شركات توزيع ووسائط. الخطوة التالية هي إطلاق منتجها الرئيسي، "ديب فريم"، منصة ذكاء اصطناعي لتحليل الفيديوهات الطويلة، التي يمكنها معالجة 200 ساعة من المحتوى للعثور بدقة على مشاهد معينة، أو متحدثين، أو أحداث. سيبدأ إصدار تجريبي في مارس 2026، يليه الإطلاق الكامل في أبريل من العام نفسه. تم تمويل الشركة بـ5.8 مليون دولار في جولة التمويل الأولية، بقيادة شركة UTEC، ومشاركة استثمارات من CX2، Headline Asia، Chiba Dojo، وباحث ذكاء اصطناعي من a16z Scout. ورغم أن المقر الرئيسي في طوكيو، فإن الشركة تخطط للانتقال إلى الولايات المتحدة، حيث تُعدّ السوق المستهدفة الكبرى. ما يميّز إنفينيميند عن منافسيها مثل TwelveLabs هو تركيزها على الاحتياجات المؤسسية، مثل المراقبة، السلامة، والأمن، مع دمج تحليل الصوت والكلام والصوت بشكل متكامل. كما تُقدّم حلولها دون الحاجة إلى كتابة أكواد، وتُعالج فيديوهات غير محدودة الطول، مع الحفاظ على الكفاءة التكلفة، وهو عامل حاسم في السوق. يُرى أن هذا المجال يُعدّ من الطرق المحورية نحو الذكاء الاصطناعي العام (AGI)، لأن فهم الفيديو يُعدّ فهمًا لواقع الحياة نفسها. وبحسب كاي، الهدف النهائي ليس فقط تحسين الأداء المؤسسي، بل دفع حدود التكنولوجيا لمساعدة البشر على اتخاذ قرارات أفضل في عالم معقد ومتغير.

الروابط ذات الصلة

مُؤسسو جوجل يبنون بنية تحتية لفهم بيانات الفيديو في الشركات | القصص الشائعة | HyperAI