HyperAIHyperAI
منذ 11 أيام

BillSum: مجموعة بيانات للتلخيص التلقائي للتشريعات الأمريكية

Anastassia Kornilova, Vlad Eidelman
BillSum: مجموعة بيانات للتلخيص التلقائي للتشريعات الأمريكية
الملخص

تم دراسة طرق التلخيص التلقائي في مجموعة متنوعة من المجالات، بما في ذلك الأخبار والمقالات العلمية. ومع ذلك، لم يُنظر من قبل إلى التشريع كمجال لهذه المهمة، على الرغم من أن الكونغرس الأمريكي والحكومات المحلية في الولايات تُصدر عشرات الآلاف من المقترحات التشريعية سنويًا. في هذه الورقة، نقدّم "BillSum"، أول مجموعة بيانات مخصصة لتلخيص مقترحات القوانين في الكونغرس الأمريكي وقوانين ولاية كاليفورنيا (https://github.com/FiscalNote/BillSum). ونوضح الخصائص التي تميّز هذه المجموعة وتجعلها أكثر تعقيدًا من غيرها من المجالات. ثم نقيّم طرق الاستخلاص التي تأخذ بعين الاعتبار تمثيلات الجمل العصبية والسمات السياقية التقليدية. وأخيرًا، نُظهر أن النماذج المبنية على مقترحات القوانين في الكونغرس يمكن استخدامها لتلخيص مقترحات القوانين في كاليفورنيا، مما يدل على إمكانية نقل الأساليب المطورة على هذه المجموعة إلى الولايات الأخرى دون الحاجة إلى ملخصات مكتوبة يدويًا.

BillSum: مجموعة بيانات للتلخيص التلقائي للتشريعات الأمريكية | أحدث الأوراق البحثية | HyperAI