CISOL: مجموعة بيانات مفتوحة وقابلة للتوسيع للاعتراف ببنية الجداول في صناعة البناء

القابلية للتكرار والنسخ هي أعمدة أساسية للبحث التجريبي، خاصة في مجال التعلم الآلي، حيث تعتمد ليس فقط على توفر النماذج، بل أيضًا على المجموعات البيانات المستخدمة لتدريب وتقييم هذه النماذج. في هذا البحث، نقدم مجموعة بيانات قائمة طلبات الصلب في صناعة البناء (CISOL)، والتي تم تطويرها بتركيز على الشفافية لضمان القابلية للتكرار والنسخ والتوسيع. تعد CISOL موردًا بحثيًا جديدًا وقيمًا وتؤكد أهمية وجود مجموعات بيانات متنوعة، حتى في المجالات المتخصصة مثل استخراج الجداول في الهندسة المدنية.تتميز CISOL بأنها تحتوي على وثائق هندسية مدنية حقيقية من الصناعة، مما يجعلها إسهامًا فريدًا في هذا المجال. تحتوي المجموعة على أكثر من 120,000 حالة مشمولة بالشروحات في أكثر من 800 صورة وثيقة، مما يجعلها مجموعة بيانات متوسطة الحجم توفر أساسًا قويًا للمهام المتعلقة باستخراج بنية الجداول (TSR) وكشف الجداول (TD).تظهر نتائج المعايرة أن CISOL تحقق دقة [email protected]:0.95:0.05 بنسبة 67.22٪ باستخدام نموذج YOLOv8، مما يتفوق على نموذج TATR المخصص لـ TSR. وهذا يؤكد فعالية CISOL كمعيار لتطوير TSR، خاصةً في المجالات المتخصصة.