HyperAI
Back to Headlines

طفرة جديدة في تقنية تحويل النص إلى فيديو: "MagicTime" يتعلم مبادئ الفيزياء من خلال مقاطع الفيديو المتسارعة waktu

منذ شهر واحد

تطور تقني جديد في مجال تحويل النصوص إلى فيديوهات: النموذج MagicTime في السنوات الأخيرة، شهدنا تطورًا ملحوظًا في نماذج الذكاء الاصطناعي التي تحول النصوص إلى مقاطع فيديو. ومع ذلك، ظلت هذه النماذج تواجه تحديات في إنتاج مقاطع الفيديو التي تصور التغيرات التحولية مثل نمو شجرة أو ازهار زهرة. هذه العمليات تتطلب معرفة دقيقة بالعالم المادي وقد تكون متنوعة بشكل كبير، مما يجعلها صعبة للغاية بالنسبة للأنظمة الذكية. لكن الآن، يبدو أن هذه النماذج قد أحرزت خطوة تطورية مهمة. قام علماء الحاسوب من جامعة روتشستر، وجامعة بكين، وجامعة كاليفورنيا سانتا كروز، وجامعة سنغافورة الوطنية بتطوير نموذج ذكاء اصطناعي جديد يتعلم المعرفة الفيزيائية الحقيقية من مقاطع الفيديو السريعة. وصف الفريق هذا النموذج الجديد، المعروف باسم "MagicTime"، في ورقة بحثية نُشرت في مجلة IEEE Transactions on Pattern Analysis and Machine Intelligence. جوانب رئيسية من MagicTime الأشخاص الرئيسيون: - جينفا هوانغ: طالب الدكتوراه في علوم الحاسوب تحت إشراف البروفيسور جي بلو من قسم علوم الحاسوب في جامعة روتشستر. - البروفيسور جي بلو: أستاذ في قسم علوم الحاسوب بجامعة روتشستر. سبب الحدث: طور فريق البحث نموذج MagicTime لتحسين قدرة الذكاء الاصطناعي على محاكاة العمليات التحولية في العالم المادي. هذه العمليات تتطلب فهمًا عميقًا للفيزياء والكيمياء والأحياء، وهي تتحدى النماذج السابقة بسبب تعقيدها ومرونتها. المراحل والتطورات: 1. تطوير قاعدة بيانات عالية الجودة: أنشأ الباحثون قاعدة بيانات تضم أكثر من 2,000 فيديو سريع مع توضيحات تفصيلية. هذه البيانات ساعدت في تدريب النموذج على تصوير التغيرات التحولية بشكل أكثر دقة ومرونة. الأساليب التقنية: يستخدم MagicTime نسخة مفتوحة المصدر من U-Net لإنشاء مقاطع فيديو مدتها ثانيتين بحجم 512 بيكسل × 512 بيكسل وبتردد 8 إطار في الثانية. كما يتميز النموذج بعمارة تمتد إلى 10 ثوانٍ باستخدام تقنية التحويل-الانتشار (diffusion-transformer). تطبيقات متعددة: يمكن لنماذج MagicTime أن تحاكي ليس فقط التحولات البيولوجية، بل أيضًا عمليات بناء المباني وخبز الخبز في الفرن. هذه القدرة تجعل النموذج متنوعًا ومفيدًا في مجالات مختلفة. النتائج النهائية: حقق النموذج MagicTime نجاحًا ملحوظًا في إنتاج مقاطع فيديو تحولية تبدو مثيرة بصريًا. ومع أن هذه المقاطع لا تزال قصيرة ومحدودة، يرى الباحثون أنها تمثل خطوة مهمة نحو نماذج أكثر تطورًا يمكن أن تقدم أدوات قيمة للمجتمع العلمي. تقييم الحدث من قِبل مختصين: يرى جينفا هوانغ أن MagicTime هو خطوة مهمة نحو الذكاء الاصطناعي الذي يمكنه محاكاة الخصائص الفيزيائية والكيميائية والأحيائية أو الاجتماعية للعالم المحيط بنا. يضيف أن النموذج يمكن أن يساعد العلماء، مثل البيولوجيين، في تسريع استكشاف الأفكار الأولية، مما يمكن أن يقلل من دورات التجربة ويحد من الحاجة إلى تجارب حية لتأكيد النتائج النهائية. نبذة تعريفية عن الشركة ذات الصلة جامعة روتشستر: تعد جامعة روتشستر واحدة من المؤسسات الأكاديمية الرائدة في الولايات المتحدة الأمريكية، وتتميز ببرامجها البحثية في مجال علوم الحاسوب والذكاء الاصطناعي. يقدم قسم علوم الحاسوب في الجامعة بيئة مشجعة للبحث والابتكار، حيث يعمل طلاب الدراسات العليا والأساتذة على تطوير حلول تقنية مبتكرة تساهم في تقدم العلم والتكنولوجيا.

Related Links