منذ 6 أشهر

الملخص

بالنسبة للوكلاء البشريين، بما في ذلك الصور الافتراضية والروبوتات الاجتماعية، فإن إجراء إيماءات مناسبة أثناء التحدث أمر بالغ الأهمية في التفاعل بين الإنسان والوكلاء. تُحسّن الإيماءات المرافقة للكلام تجربة التفاعل وتجعل الوكلاء يبدون حيّين. ومع ذلك، يُعد إنشاء إيماءات تشبه البشر صعبًا بسبب نقص الفهم حول كيفية إجراء الناس للإيماءات. تسعى النهج القائمة على البيانات إلى تعلّم مهارات الإيماء من خلال عروض بشرية، لكن الطبيعة الغامضة والفردية للإيماءات تعيق عملية التعلّم. في هذا البحث، نقدّم نموذجًا تلقائيًا لإنشاء الإيماءات يستخدم السياق متعدد الوسائط المتمثل في النص الصوتي، والصوت، وتحديد الهوية الصوتية لضمان إنتاج إيماءات تشبه البشر. وباستخدام سياق متعدد الوسائط ونموذج تدريب مُعادٍ (adversarial training)، يُنتج النموذج إيماءات تشبه البشر وتتناسب تمامًا مع محتوى الكلام ونغمته. كما نقدّم أيضًا مقياسًا كميًا جديدًا لتقييم نماذج إنشاء الإيماءات. أظهرت التجارب باستخدام هذا المقياس الجديد والتقييم الموضوعي من قبل البشر أن النموذج المقترح يتفوّق على النماذج الحالية القائمة على التوليد من النهاية إلى النهاية. ونؤكد أيضًا قدرة النموذج على العمل مع الصوت المُولّد اصطناعيًا في سياقات محدودة، ونُظهر أن أنماط إيماءات مختلفة يمكن إنشاؤها لنفس الكلام من خلال تحديد هويات متحدثين مختلفة في فضاء التضمين الأسلوبي الذي تم تعلّمه من مقاطع فيديو لمحادثات مختلفة. يُتاح كل كود وبيانات البحث على الرابط التالي: https://github.com/ai4r/Gesture-Generation-from-Trimodal-Context.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Youngwoo Yoon Bok Cha Joo-Haeng Lee Minsu Jang Jaeyeon Lee Jaehong Kim Geehyuk Lee

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Youngwoo Yoon Bok Cha Joo-Haeng Lee Minsu Jang Jaeyeon Lee Jaehong Kim Geehyuk Lee

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Youngwoo Yoon Bok Cha Joo-Haeng Lee Minsu Jang Jaeyeon Lee Jaehong Kim Geehyuk Lee

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

توليد الكلام والإيماءات من السياق الثلاثي النمط المكوّن من النص والصوت وهوية المتكلم

Youngwoo Yoon Bok Cha Joo-Haeng Lee Minsu Jang Jaeyeon Lee Jaehong Kim Geehyuk Lee

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

توليد الكلام والإيماءات من السياق الثلاثي النمط المكوّن من النص والصوت وهوية المتكلم

Youngwoo Yoon Bok Cha Joo-Haeng Lee Minsu Jang Jaeyeon Lee Jaehong Kim Geehyuk Lee

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

توليد الكلام والإيماءات من السياق الثلاثي النمط المكوّن من النص والصوت وهوية المتكلم

Youngwoo Yoon Bok Cha Joo-Haeng Lee Minsu Jang Jaeyeon Lee Jaehong Kim Geehyuk Lee

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters