Search for a command to run...
OST-Bench: تقييم قدرات النماذج اللغوية الكبيرة المتعددة في فهم المشاهد المكانية-الزمانية عبر الإنترنت