HyperAI

تخصيص ديريتشليت الكامن

تخصيص ديريتشليت المخفي LDA هو نموذج موضوعي يمكنه التعبير عن موضوع كل مستند في مجموعة مستندات في شكل توزيع احتمالي. وهي أيضًا خوارزمية تعلم غير خاضعة للإشراف ولا تتطلب مجموعات تدريب مُعلّقة يدويًا للتدريب. فهو يتطلب فقط مجموعة مستندات وعدد محدد من المواضيع K. بالإضافة إلى ذلك، يمكن العثور على بعض الكلمات لوصف كل موضوع.

تم اقتراح LDA لأول مرة من قبل Blei و David M. و Jordan و Michael I و Andrew Ng في عام 2003. ويُستخدم حاليًا في مجال استخراج النصوص مثل تحديد موضوع النص وتصنيف النص وحساب تشابه النص.

LDA هو نموذج نموذجي لحقيبة الكلمات، أي أن المقالة عبارة عن مجموعة من الكلمات، ولا يوجد ترتيب أو أسبقية بين الكلمات، ويمكن أن تحتوي الوثيقة على موضوعات متعددة، ويتم إنشاء كل كلمة في الوثيقة بواسطة الموضوع المقابل.