أكثر من ٥٨ ألف نجمة! RAGFlow يدمج تضمين Qwen3 لمعالجة بيانات التنسيقات المعقدة بسهولة؛ Webclick يفتح آفاقًا جديدة لفهم صفحات الويب.

يُحسّن إطار عمل RAG (التوليد المُعزَّز بالاسترجاع) الذي اقترحته شركة Meta عام ٢٠٢٠ دقة وموثوقية مخرجات LLM بشكل فعّال. وقد تطورت هذه التقنية من الاسترجاع البسيط الأولي والتوليد إلى نموذج متقدم بميزات فعّالة مثل الاستدلال متعدد الجولات، واستخدام الأدوات، وذاكرة السياق. معظم محركات RAG الحالية بسيطة نسبيًا في تحليل المستندات، وتعتمد على برمجيات وسيطة جاهزة للاسترجاع، مما يؤدي إلى ضعف دقة الاسترجاع.
بناءً على ذلك، يوفر InfiniFlow محرك RAGFlow مفتوح المصدر، وهو محرك RAG مفتوح المصدر يعتمد على فهم عميق للمستندات. لا يقتصر هذا المحرك على حل المشكلات المذكورة أعلاه، بل يوفر أيضًا سير عمل RAG مُعدّ مسبقًا. ما على المستخدمين سوى اتباع العملية خطوة بخطوة لبناء نظام RAG بسرعة.بعد التكامل مع Qwen3 Embedding، أصبح من الممكن بناء قاعدة معرفية محلية ونظام ذكي للإجابة على الأسئلة ووكيل في مكان واحد.
في الوقت الحاضر، أطلق الموقع الرسمي لشركة HyperAI البرنامج التعليمي "بناء نظام RAG: ممارسة تعتمد على تضمين Qwen3"، تعال وجربه~
بناء نظام RAG: ممارسة تعتمد على تضمين Qwen3
الاستخدام عبر الإنترنت:https://go.hyper.ai/FFA7f
من 23 يونيو إلى 27 يونيو، تحديثات الموقع الرسمي لـ hyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 6
* الأوراق الموصى بها لهذا الأسبوع: 5
* تفسير مقالة المجتمع: 3 مقالات
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات مع الموعد النهائي في يوليو: 5
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات فيديو سيكاي العالمية
سيكاي هي مجموعة بيانات فيديو عالمية عالية الجودة من منظور الشخص الأول، مصممة لإلهام تطبيقات قيّمة في مجالي إنتاج الفيديو واستكشاف العالم. تركز مجموعة البيانات على استكشاف العالم برؤية ذاتية، وتتكون من جزأين: سيكاي-الواقعي وسيكاي-اللعبي. تحتوي على أكثر من 5000 ساعة من مقاطع الفيديو من منظور المشي أو الطائرات بدون طيار من أكثر من 100 دولة ومنطقة و750 مدينة.
الاستخدام المباشر:https://go.hyper.ai/YyBKB

2. مجموعة بيانات صور الأقمار الصناعية Ecomapper
تحتوي مجموعة البيانات على أكثر من 2.9 مليون صورة أقمار صناعية، بما في ذلك صور RGB وبيانات قنوات متعددة الأطياف. الصور من مهمة القمر الصناعي كوبرنيكوس سنتينل، وتغطي أنواعًا متنوعة من الغطاء الأرضي ونقاطًا زمنية متعددة. تشمل مجموعة التدريب 98,930 موقعًا جغرافيًا مختلفًا، بينما تشمل مجموعة الاختبار 5,494 موقعًا. يُرفق بكل علامة زمنية لكل صورة بيانات وصفية للطقس ذات صلة، مثل معلومات درجة الحرارة والإشعاع الشمسي وهطول الأمطار.
الاستخدام المباشر:https://go.hyper.ai/1u8s6

3. مجموعة بيانات القيادة الذاتية NuScenes
NuScenes هي مجموعة بيانات عامة للقيادة الذاتية تحتوي على ما يقرب من 1.4 مليون صورة كاميرا، و390 ألف صورة مسح ليدار، و1.4 مليون صورة مسح راداري، و1.4 مليون مربع حدود للأشياء في 40 ألف إطار رئيسي من بوسطن وسنغافورة.
الاستخدام المباشر:https://go.hyper.ai/rgw1k
4. مجموعة بيانات خلية واحدة Tahoe-100M
تاهو-100M هي أكبر مجموعة بيانات خلية واحدة في العالم، مصممة لتوفير قاعدة بيانات تجريبية واقعية ومنظمة لنماذج اللغات الكبيرة (LLMs) ذات قدرات فهم التدخلات. تحتوي مجموعة البيانات على أكثر من 100 مليون خلية، وتغطي أكثر من 60,000 تجربة تدخل جزيئي، وترسم خرائط لاستجابات 50 نموذجًا للسرطان لأكثر من 1,100 علاج دوائي.
الاستخدام المباشر:https://go.hyper.ai/Hfzva
5. فهم مجموعة بيانات معايير صفحة الويب WebClick
WebClick هي مجموعة بيانات مرجعية عالية الجودة لفهم صفحات الويب، تُستخدم لتقييم قدرة النماذج والوكلاء متعددي الوسائط على فهم واجهات الويب، وتفسير أوامر المستخدم، واتخاذ إجراءات دقيقة في البيئات الرقمية. تحتوي مجموعة البيانات على 1639 لقطة شاشة لصفحات ويب باللغة الإنجليزية من أكثر من 100 موقع إلكتروني، مصحوبة بأوامر لغة طبيعية مُعلّقة بدقة، وأهداف نقر على مستوى البكسل.
الاستخدام المباشر:https://go.hyper.ai/ezz46
6. مقعد البحث العميق مقعد البحث العميق
DeepResearch Bench هي مجموعة بيانات مرجعية لوكلاء البحث العميق، تهدف إلى الكشف عن التوزيع الحقيقي لاحتياجات البحث العميق البشرية في مختلف المجالات. تحتوي مجموعة البيانات على 100 مهمة بحثية على مستوى الدكتوراه، صُممت كل منها بعناية من قِبل خبراء في 22 مجالًا مختلفًا.
الاستخدام المباشر:https://go.hyper.ai/yVHfH
7. مجموعة بيانات نص الصورة SA-Text
SA-Text هي مجموعة بيانات مرجعية واسعة النطاق لصور مشاهد عالية الجودة، مصممة لمهام استعادة الصور التي تعتمد على النصوص. تحتوي مجموعة البيانات على 105,330 صورة مشاهد عالية الدقة، مع تعليقات نصية على مستوى المضلع، تصف بدقة موقع وشكل النص في الصورة، مما يُمكّن النموذج من فهم موقع وبنية النص في الصورة بشكل أفضل.
الاستخدام المباشر:https://go.hyper.ai/ICYIY
8. مجموعة بيانات معيار التعرف على النصوص OCRBench
تحتوي مجموعة البيانات على 1000 زوج من الأسئلة والأجوبة تم فحصها وتصحيحها يدويًا من خمس مهام متعلقة بالنص التمثيلي: التعرف على النص، ومركز نص المشهد، واتجاه المستند، والمعلومات الأساسية، والتعبيرات الرياضية المكتوبة بخط اليد.
الاستخدام المباشر:https://go.hyper.ai/ZcKoD
9. مجموعة بيانات تسلسل الحمض النووي الريبي أحادي الخلية Parse-PBMC
Parse-PBMC عبارة عن مجموعة بيانات مفتوحة المصدر لتسلسل الحمض النووي الريبي أحادي الخلية، تقوم بتحليل 10 ملايين خلية من 1152 عينة في تجربة واحدة، وتستخدم بشكل أساسي لدراسة خصائص التعبير الجيني للخلايا أحادية النواة في الدم المحيطي البشري في ظل ظروف مختلفة.
الاستخدام المباشر:https://go.hyper.ai/CwOMc
10. مجموعة بيانات تحرير مثيلات الفيديو VIRESET
تهدف VIRESET إلى توفير دعم دقيق للتعليق التوضيحي لمهام مثل إعادة رسم مقاطع الفيديو والتجزئة الزمنية. تحتوي مجموعة البيانات على محتوىَين: تعليقات قناع SA-V المُحسّنة، و86 ألف مقطع فيديو.
الاستخدام المباشر:https://go.hyper.ai/5hnGF
دروس تعليمية عامة مختارة
هذا الأسبوع، قمنا بتجميع نوعين من الدروس التعليمية العامة عالية الجودة:
*دروس تعليمية حول نشر النماذج الكبيرة: 3
* دروس إنشاء الفيديو: 3
نشر نموذج كبيردرس تعليمي
1. بناء نظام RAG: ممارسة تعتمد على تضمين Qwen3
RAGFlow هو محرك RAG (استرجاع التوليد المعزز) مفتوح المصدر، يعتمد على فهم متعمق للمستندات. عند دمجه مع LLM، يوفر إمكانيات حقيقية للإجابة على الأسئلة، مدعومة بمراجع موثوقة من بيانات بتنسيقات معقدة متنوعة.
تشغيل عبر الإنترنت:https://go.hyper.ai/FFA7f
2. نشر QwenLong-L1-32B باستخدام vLLM+Open WebUI
QwenLong-L1-32B هو أول نموذج كبير لمعالجة النصوص الطويلة قائم على تدريب التعلم التعزيزي. يركز على حل مشاكل ضعف الذاكرة والارتباك المنطقي التي تواجهها النماذج الكبيرة التقليدية عند معالجة سياقات فائقة الطول (مثل 120,000 رمز). يتخطى هذا النموذج القيود السياقية للنماذج الكبيرة التقليدية، ويوفر حلاً منخفض التكلفة وعالي الأداء لسيناريوهات عالية الدقة مثل التمويل والقانون.
تشغيل عبر الإنترنت:https://go.hyper.ai/f73C2
3. vLLM + فتح WebUI نشر Magistral-Small-2506
Magistral-Small-2506 مبني على Mistral Small 3.1 (2503) مع قدرات استدلالية مُحسّنة، وتتبع SFT من خلال Magistral Medium، والتعلم التعزيزي. إنه نموذج استدلالي صغير وفعال، يحتوي على 24 مليار معلمة، وقادر على تتبع الاستدلال على سلسلة طويلة قبل تقديم إجابات لفهم المشكلات المعقدة ومعالجتها بشكل أعمق، مما يُحسّن دقة الإجابات ومنطقيتها.
تشغيل عبر الإنترنت:https://go.hyper.ai/yLeoh
برنامج تعليمي لإنشاء الفيديو
1. MAGI-1: أول نموذج توليد فيديو ذاتي الانحدار واسع النطاق في العالم
Magi-1 هو أول نموذج توليد فيديو ذاتي الانحدار واسع النطاق في العالم، يُولّد مقاطع فيديو من خلال التنبؤ الانحداري التلقائي بسلسلة من كتل الفيديو، المُعرّفة كمقاطع ثابتة الطول من الإطارات المتتالية. يحقق هذا النموذج أداءً قويًا في مهام تحويل الصور إلى مقاطع فيديو، مشروطًا بتعليمات نصية، مما يوفر اتساقًا زمنيًا عاليًا وقابلية للتوسع.
تشغيل عبر الإنترنت:https://go.hyper.ai/NZ6cc
2. FramePackLoop: أداة مفتوحة المصدر لإنشاء مقاطع فيديو متكررة سلسة
FramePackLoop هي أداة معالجة تسلسل إطارات وتوليد حلقات آلية، مصممة لتبسيط سير عمل إنتاج الفيديو. تستخدم الأداة بنية معيارية لتحقيق تجميع تسلسل الإطارات، والمحاذاة الزمنية، وتوليف حلقات سلس. وبشكل أكثر تحديدًا، تجمع الأداة بين تقدير التدفق البصري والنمذجة الزمنية القائمة على الانتباه للحفاظ على اتساق الحركة بين الإطارات.
تشغيل عبر الإنترنت:https://go.hyper.ai/WIRoM

3. VIRES: إعادة رسم فيديو ثنائي التوجيه للرسم والنص
VIRES هي طريقة لإعادة رسم مقاطع الفيديو، تجمع بين الرسومات والإرشادات النصية، وتدعم عمليات تحرير متعددة، مثل إعادة الرسم، والاستبدال، والتوليد، وإزالة عناصر الفيديو. تعتمد هذه الطريقة على المعرفة المسبقة بنماذج الفيديو المُولّدة نصيًا لضمان الاتساق الزمني. تُظهر النتائج التجريبية أن VIRES يُحقق أداءً جيدًا في جوانب عديدة، بما في ذلك جودة الفيديو، والاتساق الزمني، والمحاذاة الشرطية، وتقييمات المستخدمين.
تشغيل عبر الإنترنت:https://go.hyper.ai/GeZxZ

💡لقد قمنا أيضًا بتأسيس مجموعة تبادل تعليمية حول الانتشار المستقر. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة والتعليق على [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق ~

توصيات الورقة البحثية لهذا الأسبوع
1. ماجستير في القانون بالسحب والإفلات: صفر لقطة موجهة إلى الأوزان
تُقدّم هذه الورقة البحثية نماذج اللغة الكبيرة بالسحب والإفلات (DnD)، وهي مُولّد مُعاملات قائم على المطالبات، يُلغي الحاجة إلى التدريب لكل مهمة من خلال ربط عدد صغير من مطالبات المهام غير المُسمّاة مباشرةً بتحديثات وزن LoRA. يُحسّن مُشفّر نصّ خفيف الوزن كل دفعة مطالبات إلى تضمينات شرطية، والتي تُحوّل بدورها إلى مجموعة كاملة من مصفوفات LoRA بواسطة مُفكّك ترميز فائق الالتواء مُتتالي.
رابط الورقة:https://go.hyper.ai/hAO8y
2. ضوء المتجهات الطبيعية: تمثيل موحد للميزات للصورة المجسمة الضوئية العالمية
في هذه الورقة البحثية، نقترح طريقة جديدة للتصوير الضوئي المجسم العالمي (UniPS) لحل مشكلة استعادة المتجهات السطحية عالية الدقة في ظل ظروف إضاءة متنوعة. تُظهر النتائج التجريبية أن LINO-UniPS يتفوق على أحدث طرق التصوير الضوئي المجسم العالمي الحالية في المعايير العامة، ويُظهر قدرات تعميم قوية للتعامل مع خصائص المواد المختلفة وسيناريوهات الإضاءة.
رابط الورقة:https://go.hyper.ai/oTFMo
3. كل ما تحتاجه هو التجزئة الموجهة بالرؤية: تعزيز RAG من خلال فهم المستندات متعدد الوسائط
تقترح هذه الورقة البحثية طريقةً مبتكرةً لتجزئة المستندات متعددة الوسائط، تعتمد على نماذج متعددة الوسائط كبيرة الحجم (LMMs) لمعالجة مستندات PDF دفعةً واحدة، مع الحفاظ على التماسك الدلالي والسلامة الهيكلية. تُعالج هذه الطريقة المستندات في دفعات صفحات قابلة للتكوين، وتحافظ على المعلومات السياقية عبر الدفعات، مما يُتيح معالجة دقيقة للجداول والعناصر المرئية المُضمنة والمحتوى الإجرائي الذي يمتد على صفحات متعددة.
رابط الورقة:https://go.hyper.ai/IZA15
4. OmniGen2: الاستكشاف نحو توليد متعدد الوسائط المتقدم
تُقدّم هذه الورقة البحثية OmniGen2، وهو نموذج توليدي متعدد الاستخدامات ومفتوح المصدر يهدف إلى توفير حل موحد لمهام توليد متعددة، بما في ذلك توليد النص إلى صورة، وتحرير الصور، وتوليد السياق. بخلاف OmniGen v1، يُصمّم OmniGen2 مسارين مستقلين لفك التشفير لأنماط النص والصورة، باستخدام معلمات غير مشتركة ومُجزّئات صور منفصلة. يُمكّن هذا التصميم OmniGen2 من البناء على نماذج الفهم متعددة الأنماط الحالية دون الحاجة إلى إعادة تكييف مُدخلات VAE، مما يُحافظ على إمكانيات توليد النص الأصلية.
رابط الورقة:https://go.hyper.ai/iCFzp
5. PAROAttention: إعادة ترتيب واعية بالأنماط لتحقيق انتباه متفرق ومُكَمَّن فعال في نماذج التوليد المرئي
تقترح هذه الورقة البحثية تقنية جديدة لإعادة ترتيب العلامات مع مراعاة الأنماط (PARO)، توحّد أنماط الانتباه المتنوعة في أنماط كتل متوافقة مع الأجهزة. يُبسّط هذا التوحيد ويُحسّن بشكل كبير تأثيرات التبذير والتكميم. في هذه الطريقة، تُحقق تقنية PARO Attention توليد الفيديو والصور دون أي فقدان يُذكر للمقاييس، وتُحقق نتائج تُقارب نتائج خط الأساس كامل الدقة مع انخفاض ملحوظ في الكثافة وعرض البت، مما يُحسّن من تسريع زمن الوصول من البداية إلى النهاية بمقدار يتراوح بين 1.9x و2.7x.
رابط الورقة:https://go.hyper.ai/sScNH
مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:https://go.hyper.ai/iSYSZ
تفسير مقالة المجتمع
أصدرت جوجل ديب مايند نموذج ألفا جينوم، الذي يمكنه التنبؤ بآلاف الخصائص الجزيئية المرتبطة بنشاطها التنظيمي، ويمكنه أيضًا تقييم تأثير التباين أو الطفرة الجينية من خلال مقارنة نتائج التنبؤ بالتسلسلات المتغيرة وغير المتغيرة. ومن أهم إنجازات ألفا جينوم القدرة على التنبؤ بوصلات الربط مباشرةً من التسلسلات واستخدامها للتنبؤ بتأثير التباين.
شاهد التقرير الكامل:https://go.hyper.ai/o8E1F
قدم البروفيسور لي دونغ، مدير مركز علوم البيانات الطبية في مستشفى تسينغهوا تشانج جونج، عرضًا خاصًا حول "كيفية استخدام البيانات الطبية لإجراء أبحاث مبتكرة في عصر الرعاية الصحية الذكية" في مؤتمر بكين تشي يوان 2025، حيث قدم الابتكارات التي جلبتها النماذج الكبيرة في عصر الرعاية الصحية الذكية.
شاهد التقرير الكامل:https://go.hyper.ai/rAabv
أطلقت منظمة آرك البحثية غير الربحية، بالتعاون مع فرق بحثية من جامعة كاليفورنيا، بيركلي، وجامعة ستانفورد، وجامعات أخرى، نموذج الخلية الافتراضية STATE، الذي يمكنه التنبؤ باستجابة الخلايا الجذعية، والخلايا السرطانية، والخلايا المناعية للأدوية، والسيتوكينات، أو التدخلات الجينية. تُظهر النتائج التجريبية أن نموذج STATE يتفوق بشكل ملحوظ على الطرق السائدة حاليًا في التنبؤ بتغيرات النسخ الجيني بعد التدخل.
شاهد التقرير الكامل:https://go.hyper.ai/B3Rc6
مقالات موسوعية شعبية
1. دال-إي
2. دمج الفرز المتبادل RRF
3. جبهة باريتو
4. فهم اللغة متعدد المهام على نطاق واسع (MMLU)
5. التعلم التبايني
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
الموعد النهائي للقمة في يوليو
2 يوليو 7:59:59 قاعدة بيانات VLDB 2026
11 يوليو 7:59:59 بوبل 2026
15 يوليو 7:59:59 صودا 2026
18 يوليو 7:59:59 سيجمود 2026
19 يوليو 7:59:59 اي سي اس اي 2026
تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!