MarkItDown، أداة تحويل المستندات مفتوحة المصدر من مايكروسوفت
1. مقدمة البرنامج التعليمي

MarkItDown هي أداة تحويل مستندات بايثون خفيفة الوزن وسهلة الاستخدام تم إطلاقها بواسطة فريق مايكروسوفت في أغسطس 2025. وتهدف إلى تحويل تنسيقات المستندات والوسائط المتعددة الشائعة المختلفة إلى Markdown بكفاءة وهيكلية، مما يوفر تنسيق إدخال محسّن خصيصًا لفهم النصوص وتحليلها في نماذج اللغة الكبيرة (LLMs).
تُعالج هذه الأداة بشكل منهجي المشكلات الأساسية المتمثلة في فقدان المعلومات الهيكلية وحذف العناصر الدلالية عند تحويل تنسيقات المستندات المعقدة (مثل PDF وPPT) إلى نص عادي. لا يهدف تصميمها إلى تحقيق دقة بصرية للقراءة البشرية، بل يُعطي الأولوية لضمان الحفاظ على البنى المنطقية الرئيسية للمستند (مثل العناوين والقوائم والجداول والروابط، إلخ) لمعالجة الذكاء الاصطناعي اللاحقة، مما يحقق توازنًا بين توافق التنسيق ودقة البنية وكفاءة المعالجة.
يستخدم هذا البرنامج التعليمي بطاقة رسومات RTX 5090 واحدة كمورد افتراضي.
2. أمثلة المشاريع

3. خطوات التشغيل
1. ابدأ تشغيل الحاوية

2. بعد الدخول إلى صفحة الويب، يمكنك استخدام النموذج
إذا ظهرت رسالة "Bad Gateway"، فهذا يعني أن النموذج قيد التهيئة. يُرجى الانتظار من دقيقتين إلى ثلاث دقائق ثم تحديث الصفحة. يدعم البرنامج ملفات PDF، وPowerPoint (.pptx)، وWord (.docx)، وExcel (.xlsx)، وHTML، والصور (OCR)، والصوت (تحويل الكلام إلى نص)، وملفات ZIP، وروابط فيديوهات YouTube، والكتب الإلكترونية بصيغة EPUB، بالإضافة إلى صيغ نصية متنوعة (CSV / JSON / XML).

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.