تجميع النصوص
تجميع النصوص هو مهمة مهمة في معالجة اللغات الطبيعية، يهدف إلى تقسيم مجموعة من النصوص إلى عدة مجموعات بناءً على مقياس معين للتشابه، بحيث يكون التشابه بين النصوص داخل المجموعة الواحدة أعلى مما هو عليه مع النصوص في المجموعات الأخرى. يمكن لهذا الأسلوب أن يكتشف بشكل تلقائي الهياكل الخفية في بيانات النص، مما يحسن كفاءة ودقة التطبيقات مثل استرجاع المعلومات، تصنيف الوثائق، وتحديد المواضيع.