HyperAIHyperAI
منذ 2 أشهر

IAM: تحسين تقسيم الحالات باستخدام الصور ثلاثية الأبعاد مع مقاييس جديدة

Jung, Aecheon ; Choi, Soyun ; Min, Junhong ; Hong, Sungeun
IAM: تحسين تقسيم الحالات باستخدام الصور ثلاثية الأبعاد مع مقاييس جديدة
الملخص

تعد تقسيم الصور مهمة حيوية لتقديم المساعدة البشرية وتعزيز الاستقلالية في حياتنا اليومية. وبشكل خاص، جذبت تقنيات تقسيم الصور باستخدام البيانات البصرية والعمق (RGB-D) اهتمامًا متزايدًا، حيث تُعدّ هذه التقنيات واعدة في توفير فهم أعمق للمناظر مقارنة بالطرق التي تعتمد على البيانات البصرية فقط (RGB). ومع ذلك، ركزت معظم الجهود الحالية بشكل أساسي على التقسيم الدلالي (semantic segmentation)، مما يترك فجوة حرجة. هناك نقص نسبي في قواعد بيانات تقسيم الصور RGB-D على مستوى المثال (instance-level)، مما يحد من الطرق الحالية إلى التمييز بين الفئات الواسعة بدلاً من التقاط التفاصيل الدقيقة اللازمة لتحديد الأشياء الفردية. لسد هذه الفجوة، نقدم ثلاثة مقاييس مرجعية لتقسيم الصور RGB-D على مستوى المثال، والتي تميزها على هذا المستوى. تتميز هذه القواعد البيانات بالمرونة وتدعم مجموعة واسعة من التطبيقات، من التنقل الداخلي إلى التلاعب الروبوتي. بالإضافة إلى ذلك، نقدم تقييمًا شاملًا لمجموعة متنوعة من النماذج الأساسية在这三个基准上。这项综合分析确定了它们的优势和不足,为未来的工作指明了方向,朝着更强大、更具普遍性的解决方案迈进。最后,我们提出了一种简单而有效的方法来整合RGB-D数据。广泛的评估证实了我们方法的有效性,提供了一个强大的框架,有助于实现更加细致的场景理解。为了确保翻译完全符合阿拉伯语的表达习惯,我将对最后一段进行调整:بالإضافة إلى ذلك، نقدم تقييمًا شاملًا لمجموعة متنوعة من النماذج الأساسية在这三个基准上(on these benchmarks)。这项综合分析(This comprehensive analysis) xác địnhت كل من نقاط القوة والضعف لديها، مما يوجه العمل المستقبلي نحو حلول أكثر صلابة وقابلية للتعميم. أخيرًا، نقترح طريقة بسيطة ولكن فعالة لدمج بيانات RGB-D. الإvaluations تأكدت من فعالية طريقتنا، مما يقدم إطار عمل قوي للتقدم نحو فهم مشهد أكثر دقة وتفصيلاً.再次调整以确保完全符合阿拉伯语表达习惯:بالإضافة إلى ذلك، نقدم تقييمًا شاملًا لمجموعة متنوعة من النماذج الأساسية على هذه المقاييس المرجعية. تقوم هذه التحليل الشامل بتحديد نقاط القوة والضعف لديها، مما يوجه العمل المستقبلي نحو حلول أكثر صلابة وقابلية للتعميم. أخيرًا، نقترح طريقة بسيطة ولكن فعالة لدمج بيانات RGB-D. الإvaluations تأكدت من فعالية طريقتنا، مما يقدم إطار عمل قوي للتقدم نحو فهم مشهد أكثر دقة وتفصيلاً.最终版本如下:بالإضافة إلى ذلك، نقدم تقييمًا شاملًا لمجموعة متنوعة من النماذج الأساسية على هذه المقاييس المرجعية. يقوم هذا التحليل الشامل بتحديد نقاط القوة والضعف لديها، مما يوجه العمل المستقبلي نحو حلول أكثر صلابة وقابلية للتعميم. أخيرًا، نقترح طريقة بسيطة ولكن فعالة لدمج بيانات RGB-D. أكدت التقييمات الواسعة فعالية طريقتنا، مما يقدم إطار عمل قوي للتقدم نحو فهم مشهد أكثر دقة وتفصيلاً.

IAM: تحسين تقسيم الحالات باستخدام الصور ثلاثية الأبعاد مع مقاييس جديدة | أحدث الأوراق البحثية | HyperAI