الملخص

يصف هذا البحث مجموعة البيانات VICTOR، وهي مجموعة بيانات جديدة تم إنشاؤها من الوثائق القانونية الرقمية الصادرة عن المحكمة العليا في البرازيل، وتشمل أكثر من 45 ألف طعن، وتتألف من حوالي 692 ألف وثيقة—ما يعادل حوالي 4.6 مليون صفحة. تحتوي المجموعة على بيانات نصية مُصنّفة، وتدعم نوعين من المهام: تصنيف نوع الوثيقة، وتعيين الموضوع، وهي مهمة متعددة التصنيفات. نقدم نتائج أساسية باستخدام نماذج "مجموعة الكلمات" (bag-of-words)، والشبكات العصبية التلافيفية (CNN)، والشبكات العصبية التكرارية (RNN)، وتقنيات التقوية (boosting). كما قمنا بتجربة استخدام الحقول العشوائية الشرطية المتسلسلة (Linear-chain Conditional Random Fields) للاستفادة من الطبيعة التسلسلية للدعاوى القضائية، ووجدنا أن هذا النهج يُسهم في تحسين أداء تصنيف نوع الوثيقة. وأخيرًا، قارنا بين نهج تصنيف الموضوع يستخدم المعرفة الخاصة بالمجال لاستبعاد الصفحات الأقل إفادة، وبين النهج الافتراضي الذي يستخدم جميع الصفحات. وخلافًا لتوقعات خبراء المحكمة، وجدنا أن استخدام جميع البيانات المتاحة هو الطريقة الأفضل. ونُقدّم مجموعة البيانات في ثلاث إصدارات بمقاسات ومضامين مختلفة، بهدف تشجيع البحث عن نماذج وتقنيات أكثر تطورًا.

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

فيكتور: مجموعة بيانات لتصنيف الوثائق القانونية البرازيلية

Te\'ofilo Em\'\idio de Campos Pedro Henrique Luz de Araujo Nilton Correia da Silva Fabricio Ataides Braz

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

فيكتور: مجموعة بيانات لتصنيف الوثائق القانونية البرازيلية

Te\'ofilo Em\'\idio de Campos Pedro Henrique Luz de Araujo Nilton Correia da Silva Fabricio Ataides Braz

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

فيكتور: مجموعة بيانات لتصنيف الوثائق القانونية البرازيلية

Te\'ofilo Em\'\idio de Campos Pedro Henrique Luz de Araujo Nilton Correia da Silva Fabricio Ataides Braz

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters