CityDreamer: نموذج توليدي تكاملي لمدن ثلاثية الأبعاد غير محدودة

إن إنشاء المدن ثلاثية الأبعاد هو مهمة مرغوبة ولكنها صعبة، نظرًا لحساسية البشر تجاه التشوهات الهيكلية في البيئات الحضرية. علاوة على ذلك، فإن إنشاء المدن ثلاثية الأبعاد أكثر تعقيدًا من إنشاء المشاهد الطبيعية ثلاثية الأبعاد، لأن المباني، ككائنات من نفس الفئة، تُظهر تنوعًا أكبر في المظهر مقارنةً بالكائنات مثل الأشجار في المشاهد الطبيعية التي تتميز بملامح أكثر اتساقًا. لمعالجة هذه التحديات، نقترح نموذج التوليد المركب \textbf{CityDreamer} المصمم خصيصًا لإنشاء مدن ثلاثية الأبعاد غير محدودة. تكمن رؤيتنا الأساسية في أن إنشاء المدن ثلاثية الأبعاد يجب أن يكون تجميعًا ل不同类型 من الحقول العصبية: 1) مختلف حالات المباني، و2) الكائنات الخلفية مثل الطرق والأراضي الخضراء. وبشكل محدد، نستخدم تمثيلًا من منظور الطيور (bird's eye view) للسيناريو، ونطبّق ترميمًا حجميًا (volumetric render) لكل من الحقول العصبية الموجهة نحو الكائنات (instance-oriented) والحقول العصبية الموجهة نحو الخلفية (stuff-oriented). كما نخصص شبكة التجزئة التوليدية (generative hash grid) وتمثيل الإدخال المداري (periodic positional embedding) كوسيلة لتمثيل المشهد، بما يتناسب مع الخصائص المختلفة بين حالات المباني والكائنات الخلفية. علاوة على ذلك، نقدم مجموعة من مجموعات بيانات CityGen، تشمل بيانات OSM وGoogleEarth، والتي تتضمن كميات ضخمة من الصور الحقيقية للمدن، بهدف تعزيز واقعية المدن ثلاثية الأبعاد المولدة من حيث التخطيط والملامح. يحقق CityDreamer أداءً متقدمًا في مجال التوليد، ليس فقط في إنشاء مدن ثلاثية الأبعاد واقعية، بل أيضًا في عمليات التعديل الموضعي داخل المدن المولدة.