HyperAI
Back to Headlines

فريق MIT يطورSketchAgent: أداة تعاونية بين البشر والذكاء الاصطناعي لتخطيط الصور بشكل أكثر شبهًا بالإنسان

منذ شهر واحد

فريق من جامعة ماساتشوستس للتكنولوجيا (MIT) قد تمكن من تطوير نظام ذكاء اصطناعي يدعى "SketchAgent" يمكنه إنشاء رسومات تشبه الرسومات البشرية. هذا النظام ليس فقط قادرًا على إنتاج الرسومات بشكل مستقل، بل يمكن أيضًا للبشر التواصل معه لإنشاء أعمال فنية مشتركة. تم اختبار SketchAgent في بيئة تعاونية عبر الإنترنت حيث يمكن للمستخدمين تبادل الرسومات وتعديلها بناءً على مفاهيم نصية معينة. في التجارب التي أجريت باستخدام SketchAgent، اكتشف الفريق أن التفاعلات البشرية مع النظام كانت مهمة للغاية لتطوير الرسومات النهائية. على سبيل المثال، عندما تم حذف التفاعلات البشرية، أصبح من الصعب التعرف على الرسومات النهائية. الألوان الخضراء تشير إلى التفاعلات البشرية، بينما تشير الألوان الزرقاء إلى تفاعلات SketchAgent. يمكن للمستخدمين أيضًا تعديل الرسومات عن طريق الدردشة مع النظام وإجراء التعديلات اللازمة. قدم الباحثون أمثلة للرسومات التي أنتجها SketchAgent، والتي تشمل رسومات لروبوتات، طيور، حلقات الـ DNA، مخططات تدفق البيانات، وحتى مشاهد من أفلام الخيال العلمي. بحسب ما أشارت إليه الباحثة تمار روت شاهام، فإن هذا النموذج يتعامل مع المعلومات البصرية بطريقة تختلف عن النماذج الأخرى، مما يجعله أكثر فعالية في التكيف مع الإرشادات البشرية. تشير شاهام إلى أنSketchAgent قد يصبح أداة تعاونية جديدة بين البشر والآلات في مجال الإبداع الفني: "مع تحسن قدرة النموذج على فهم الرسومات المتعددة الأشكال، سيتمكن المستخدمون من الحصول على طرق أكثر تعبيرية وشخصية لإظهار أفكارهم، مما يعزز التجربة الإبداعية ويحسن سهولة استخدام الذكاء الاصطناعي والمرونة في الاستجابة للإرشادات البشرية." بالرغم من الإمكانات الهائلة التي يمتلكها SketchAgent، فإنه ما زال غير قادر على إكمال الرسومات المهنية بشكل كامل. يمكنه تقديم رسومات أساسية بسيطة، ولكنه يعاني من صعوبة في رسم العناصر المعقدة مثل العلامات التجارية، الجمل، الأطراف البشرية، وغيرها. خلال عملية التعاون، يظهر النموذج فقط التفسيرات الخاطئة - مثل رسم طفل ذو رأسين. يوضح فينكر أن هذا قد يكون نتيجة لطريقة "السلاسل的思想链" التي يستخدمها النموذج: عند تقسيم مهمة الرسم إلى عدة خطوات، قد يساء فهم أي جزء من الرسم البشري الذي يجب أن يقوم به النظام. يعتقد الباحثون أن توسيع النموذج لتشمل بيانات أكثر قد يحسن قدراته في الرسم. في المستقبل، يخطط الفريق لتحسين تجربة التعاون بين البشر وأدوات الذكاء الاصطناعي عن طريق تبسيط التدفق الزمني للرسم مع العديد من النماذج اللغوية المختلفة. ومع ذلك، فقد ثبت أنSketchAgent قادر على استخدام التفكير البشري لرسم مفاهيم متعددة، مما يؤدي في النهاية إلى تحقيق نتائج تصميم أكثر تكاملًا. مواقع الإشارة: 1. https://yael-vinker.github.io/sketch-agent/ 2. https://news.mit.edu/2025/teaching-ai-models-to-sketch-more-like-humans-0602 ملاحظة: قد يتم تحويل السلاسل的思想链 إلى "سلسلة التفكير" في العربية، والتي تعني السلسلة أو النمط الذي يتبعه الذكاء الاصطناعي في تفكيره وتحليله للمهام.

Related Links