HyperAIHyperAI
منذ 17 أيام

بيرسيفر أيو: معمارية عامة للمدخلات والنتائج الهيكلية

Andrew Jaegle, Sebastian Borgeaud, Jean-Baptiste Alayrac, Carl Doersch, Catalin Ionescu, David Ding, Skanda Koppula, Daniel Zoran, Andrew Brock, Evan Shelhamer, Olivier Hénaff, Matthew M. Botvinick, Andrew Zisserman, Oriol Vinyals, Joāo Carreira
بيرسيفر أيو: معمارية عامة للمدخلات والنتائج الهيكلية
الملخص

الهدف المركزي للتعلم الآلي هو تطوير أنظمة قادرة على حل العديد من المشكلات في أكبر عدد ممكن من مجالات البيانات. ومع ذلك، لا يمكن تطبيق المعماريات الحالية خارج مجموعة صغيرة من البيئات المعيارية، نظرًا لأنها تُدمج افتراضات متعلقة بالبيئة أو المهمة، أو تُظهر أداءً ضعيفًا عند التعامل مع مدخلات أو مخرجات كبيرة. في هذه الدراسة، نقترح معمارية Perceiver IO، وهي معمارية عامة تُعالج بيانات من بيئات متنوعة، مع التمدد الخطي حسب حجم المدخلات والمخرجات. تعزز نموذجنا معمارية Perceiver بآلية استعلام مرنة تتيح مخرجات بمقاييس ودلالات مختلفة، مما يزيل الحاجة إلى هندسة معمارية مخصصة لكل مهمة. وتُحقق نفس المعمارية نتائج قوية على مهام تشمل فهم اللغة الطبيعية والرؤية الحاسوبية، والتفكير متعدد المهام ومتعدد الوسائط، وتحدي StarCraft II. كأبرز إنجازات، تفوق Perceiver IO على نموذج BERT المستند إلى Transformer في معيار تقييم GLUE للغة، رغم إزالة عملية تجزئة المدخلات، وتحقيق أداءً رائدًا في تقدير تدفق الصور Sintel دون استخدام آليات صريحة للتوافق متعدد المقاييس.

بيرسيفر أيو: معمارية عامة للمدخلات والنتائج الهيكلية | أحدث الأوراق البحثية | HyperAI