تقنية ذكاء اصطناعي تُحول صورة واحدة لحيوان أليف إلى نموذج ثلاثي الأبعاد قابل للتحريك
أعلن باحثون من جامعة UNIST عن تطوير تقنية ذكاء اصطناعي مبتكرة تُعرف باسم "DogRecon"، تُمكّن من إنشاء نماذج ثلاثية الأبعاد واقعية وقابلة للتحريك لحيوانات الأليفة، لا سيما الكلاب، من صورة واحدة فقط. تم نشر النتائج في مجلة International Journal of Computer Vision، حيث يُعد هذا الإنجاز خطوة مهمة في تمكين تجربة رقمية حية لحيوانات الأليفة في بيئات الواقع الافتراضي، والواقع المعزز، والمتaverse. قاد البحث البروفيسور كيونغدون جو من كلية الذكاء الاصطناعي في جامعة UNIST، وتم تنفيذه بقيادة الباحث غيونغسو تشو، بمساهمة الباحثين تشانغوو كانغ من UNIST ودونهيون سون من DGIST. يتميز DogRecon بقدرته على استخلاص نموذج ثلاثي الأبعاد دقيق للكلب، بما في ذلك الشكل، والملمس، والحركة، من صورة ثنائية الأبعاد واحدة، وهو ما يُعد تحديًا كبيرًا بسبب تنوع السلالات، وتمايز الأشكال، وصعوبة رؤية الأطراف في وضعية الأرجل الأربعة. للتغلب على هذه التحديات، استخدم الفريق نماذج إحصائية مبنية على السلالات المختلفة للكلاب، ما يسمح بالتقاط التفاصيل الدقيقة في الوضعية والبنية الجسدية. كما اعتمد على تقنيات الذكاء الاصطناعي التوليدي لتوليد مناظر متعددة من الصورة الأصلية، مما يُساعد في تغطية المناطق المُحجبة مثل الأطراف أو الذيل. واستُخدمت تقنية "النقطة الغاوسية" (Gaussian Splatting) لمحاكاة التفاصيل الدقيقة مثل تجعيدات الفراء وانحناءات الجسم بشكل واقعي. أظهرت تجارب الأداء على مجموعات بيانات متنوعة أن النماذج الناتجة من DogRecon تتفوق في الواقعية والدقة مقارنة بالأساليب القائمة على مقاطع فيديو، رغم الاعتماد على صورة واحدة فقط. كما تجنبت النماذج الناتجة التحريفات الشائعة في النماذج السابقة، مثل تقوس الأطراف أو تجمع الفراء والذيل، خاصة في الحالات التي تكون فيها الكلاب في وضعية جلوس أو تمدد. تميّزت التقنية أيضًا بقدرتها على التكيف مع التحكم النصي، حيث يمكن توليد نماذج ثلاثية الأبعاد قابلة للتحريك بناءً على وصف نصي، مما يفتح آفاقًا واسعة في إنشاء مشاهد تفاعلية. كما تُعد DogRecon متوافقة مع البيئات الواقع المعزز والافتراضي، ما يسمح للمستخدمين بتجربة حيواناتهم الأليفة كأفاتار رقمي في عوالم افتراضية. أشار غيونغسو تشو إلى أن أكثر من ربع المنازل في العالم تمتلك حيوانات أليفة، مما يجعل توسيع تقنيات النمذجة ثلاثية الأبعاد، التي كانت مركّزة سابقًا على البشر، إلى الحيوانات أداة مهمة ومتوقعة. وأضاف البروفيسور جو أن هذه الدراسة تمثل تقدماً مهماً في دمج الذكاء الاصطناعي التوليدي مع إعادة بناء النماذج ثلاثية الأبعاد، ويتوقعون توسيع النموذج لتشمل أنواعًا أخرى من الحيوانات والشخصيات الرقمية الشخصية في المستقبل.