HyperAIHyperAI
منذ 2 أشهر

ZeroFlow: التدفق المكاني القابل للتوسيع عبر التقطير

Kyle Vedder; Neehar Peri; Nathaniel Chodosh; Ishan Khatri; Eric Eaton; Dinesh Jayaraman; Yang Liu; Deva Ramanan; James Hays
ZeroFlow: التدفق المكاني القابل للتوسيع عبر التقطير
الملخص

تقدير التدفق المناظري هو مهمة وصف حقل الحركة ثلاثي الأبعاد بين السحب النقطية المتتابعة زمنياً. تستخدم الطرق الرائدة في هذا المجال قيوداً قوية وتقنيات الأمثلة في وقت الاختبار، ولكنها تتطلب عشرات الثوانٍ لمعالجة السحب النقطية الكاملة الحجم، مما يجعلها غير قابلة للاستخدام كعناصر أساسية في رؤية الكمبيوتر للتطبيقات الزمنية الحقيقية مثل اكتشاف الأشياء في العالم المفتوح. تكون الطرق التغذوية أسرع بكثير، حيث تعمل بسرعة تتراوح بين العشرات إلى المئات من الميليشندا ثانية للسحب النقطية الكاملة الحجم، لكنها تتطلب إشرافاً بشرياً باهظ الثمن. لحل هذين القيدَين، نقترح تقدير التدفق المناظري عبر التقطير، وهو إطار تقطير بسيط وقابل للتوسع يستخدم طريقة أمثلة بدون علامات لإنتاج علامات مزيفة لإشراف نموذج تغذوي. يحقق تنفيذنا لهذا الإطار، المعروف باسم ZeroFlow، أداءً رائداً في تحدي Argoverse 2 للتدفق المناظري الذاتي-الإشرافي بينما يستخدم صفر العلامات البشرية من خلال التدريب ببساطة على بيانات غير مصنفة ذات نطاق كبير ومتنوع. عند وقت الاختبار، يكون ZeroFlow أسرع بمقدار أكثر من 1000 مرة من أفضل الطرق المبنية على الأمثلة بدون علامات على السحب النقطية الكاملة الحجم (34 صورة في الثانية مقابل 0.028 صورة في الثانية) وأرخص بمقدار أكثر من 1000 مرة للتدريب على البيانات غير المصنفة مقارنة بتكلفة الإشراف البشري (394 دولارًا مقابل حوالي 750,000 دولار). لتسهيل البحث المستقبلي، نقوم بإصدار شفرتنا ومعلمات النموذج المدرب والعلامات المزيفة عالية الجودة لمجموعتي بيانات Argoverse 2 وWaymo Open على الرابط https://vedder.io/zeroflow.html

ZeroFlow: التدفق المكاني القابل للتوسيع عبر التقطير | أحدث الأوراق البحثية | HyperAI