الرؤية الموجهة للتقسيم هي كل ما تحتاجه: تعزيز RAG بفهم الوثائق متعددة الوسائط

نظام التوليد المُعزز بالاسترجاع (RAG) قد ثورة في استرجاع المعلومات وإجابة الأسئلة، ولكن طرق التقسيم النصية التقليدية تواجه صعوبات مع هياكل الوثائق المعقدة، الجداول متعددة الصفحات، الأشكال المضمنة والارتباطات السياقية عبر حدود الصفحات. نقدم هنا منهجًا جديدًا للتقسيم متعدد الوسائط للوثائق يستفيد من نماذج متعددة الوسائط كبيرة الحجم (LMMs) لمعالجة وثائق PDF دفعةً واحدة مع الحفاظ على الت Kohanistency الدلالية والسلامة الهيكلية. طريقة عملنا تقوم بمعالجة الوثائق بدفقات صفحات قابلة للتخصيص مع الحفاظ على السياق بين الدفعات، مما يمكّن من التعامل بدقة مع الجداول التي تمتد عبر عدة صفحات، العناصر المرئية المضمنة والمحتوى الإجرائي. لقد قمنا بتقييم منهجيتنا على مجموعة بيانات مُعدة بعناية تتكون من وثائق PDF ومع أسئلة مُعدة يدويًا، مما أظهر تحسينات في جودة التقسيمات وأداء RAG اللاحق.نهجنا الذي يُرشده الرؤية يحقق دقة أفضل مقارنة بأنظمة RAG التقليدية البسيطة، حيث أظهرت التحليلات النوعية حفظًا أفضل لهيكل الوثيقة والتماسك الدلالي.注释:- "Kohanistency" 一词在阿拉伯语中没有直接对应的词汇,这里可能需要根据上下文调整为 "التماسك" 或 "الترابط"。如果需要进一步的专业术语校对,请告知。修正后的版本:نظام التوليد المُعزز بالاسترجاع (RAG) قد ثورة في استرجاع المعلومات وإجابة الأسئلة، ولكن طرق التقسيم النصية التقليدية تواجه صعوبات مع هياكل الوثائق المعقدة، الجداول متعددة الصفحات، الأشكال المضمنة والارتباطات السياقية عبر حدود الصفحات. نقدم هنا منهجًا جديدًا للتقسيم متعدد الوسائط للوثائق يستفيد من نماذج متعددة الوسائط كبيرة الحجم (LMMs) لمعالجة وثائق PDF دفعةً واحدة مع الحفاظ على التماسك الدلالي والسلامة الهيكلية.طريقة عملنا تقوم بمعالجة الوثائق بدفقات صفحات قابلة للتخصيص مع الحفاظ على السياق بين الدفعات، مما يمكّن من التعامل بدقة مع الجداول التي تمتد عبر عدة صفحات، العناصر المرئية المضمنة والمحتوى الإجرائي. لقد قمنا بتقييم منهجيتنا على مجموعة بيانات مُعدة بعناية تتكون من وثائق PDF ومع أسئلة مُعدة يدويًا، مما أظهر تحسينات في جودة التقسيمات وأداء RAG اللاحق.نهجنا الذي يُرشده الرؤية يحقق دقة أفضل مقارنة بأنظمة RAG التقليدية البسيطة، حيث أظهرت التحليلات النوعية حفظًا أفضل لهيكل الوثيقة والتماسك الدلالي.