Command Palette
Search for a command to run...
أحدث تقنيات الكشف عن الأجسام في الوقت الفعلي! YOLOv13 يُوسّع قدرات الإدراك العالمي؛ مُختار لـ NeurIPS 2025، UltraHR-100K يُتيح صورًا نسيجية فائقة الدقة.

لطالما كان الكشف الفوري عن الأجسام مجالًا بحثيًا رائدًا في مجال الرؤية الحاسوبية. من الكشف الصناعي إلى القيادة الذاتية، لم يتوقف سعي الأوساط العلمية والصناعية لتحقيق "السرعة" و"الدقة". في هذا المجال، احتلت سلسلة نماذج YOLO مكانة رائدة بفضل توازنها الممتاز بين سرعة الاستدلال ودقته.
لكن،من الإصدارات المبكرة من YOLO إلى YOLOv11 الأخيرة، وحتى YOLOv12 الذي يستخدم آلية الاهتمام الذاتي بالمنطقة، تواجه جميعها قيودًا في التعامل مع السيناريوهات المعقدة:لا تستطيع العمليات التلافيفية تجميع المعلومات إلا ضمن مجال استقبال محلي ثابت، وتقتصر قدرتها على النمذجة على حجم نواة الالتفاف وعمق الشبكة. على الرغم من أن آلية الانتباه الذاتي تُوسّع مجال الاستقبال، إلا أنها لا تزال بحاجة إلى موازنة التكلفة الحسابية العالية للنمذجة الشاملة والإدراك. والأهم من ذلك، أن الانتباه الذاتي لا يستطيع أساسًا سوى نمذجة الارتباطات الثنائية بين وحدات البكسل.
ولمعالجة هذه التحديات، تم تحديث سلسلة YOLO إلى أحدث إصدار لها، YOLOv13.يُقدّم الإصدار الجديد آلية تعزيز الصلة التكيفية القائمة على الرسم البياني الفائق (HyperACE)، والتي تستخدم تكيفيًا الصلات المحتملة من الدرجة الأعلى. يتخطى هذا قيود الطرق السابقة، التي كانت تقتصر على نمذجة الصلة الزوجية القائمة على حساب الرسم البياني الفائق، ويحقق دمجًا وتحسينًا فعالًا للميزات عبر المواقع والمقاييس العالمية. بناءً على مزايا الكشف الآني في سلسلة YOLO، يُقدّم الإصدار الجديد أيضًا سلسلة من الآليات الجديدة مثل النمذجة الدلالية من الدرجة الأعلى وإعادة البناء الهيكلي البسيط.يمتد هذا من نمذجة التفاعل الزوجي التقليدية القائمة على المنطقة إلى نمذجة الارتباط العالمية عالية المستوى.
لقد حققت YOLOv13 ريادة شاملة في مجموعات البيانات الرئيسية مثل MS COCO وPascal VOC.وهو يوضح قدرات التعميم الأقوى والعملية العملية للنشر، مما يوفر خيارات أداء أكثر تقدمًا للتطبيقات في السيناريوهات المعقدة.

يُتيح موقع HyperAI الآن نشر Yolov13 بنقرة واحدة. جرّبها!
الاستخدام عبر الإنترنت:https://go.hyper.ai/PAcy1
نظرة عامة سريعة على التحديثات التي طرأت على موقع hyper.ai من 3 نوفمبر إلى 7 نوفمبر:
* مجموعات البيانات العامة عالية الجودة: 10
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3
* الأوراق الموصى بها لهذا الأسبوع: 5
* تفسير المقالات المجتمعية: 5 مقالات
* إدخالات الموسوعة الشعبية: 5
أهم المؤتمرات التي تنتهي في نوفمبر: 5
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات مؤشرات صحة مرض السكري
مؤشرات صحة السكري هي مجموعة بيانات تحليلية صحية وطبية شاملة، مصممة لدعم التنبؤ بمخاطر السكري، وأبحاث الصحة العامة، ونمذجة التعلم الآلي. تحتوي مجموعة البيانات على 31 مجالًا لخصائص السكري، تغطي أربع فئات رئيسية من المتغيرات: الخصائص الديموغرافية، ونمط الحياة، والتاريخ الطبي، والمؤشرات السريرية.
الاستخدام المباشر:https://go.hyper.ai/nVnPo
2. Nemotron Personas USA: مجموعة بيانات لمجموعات بيانات الشخصيات الأمريكية.
Nemotron-Personas-USA هي مجموعة بيانات ملف تعريف مستخدم اصطناعي واسعة النطاق أصدرتها NVIDIA، وهي مصممة لدعم تدريب وتقييم نماذج اللغة الكبيرة (LLMs) وأنظمة الوكيل الذكية في المهام مثل إنشاء الحوار ومحاكاة الأدوار ونمذجة المستخدم وتحليل السلوك المتنوع.
الاستخدام المباشر:https://go.hyper.ai/lMA6r

3. مجموعة بيانات الصور فائقة الدقة UltraHR-100K
UltraHR-100K هي مجموعة بيانات واسعة النطاق وعالية الجودة لمهمة تحويل النص إلى صورة (T2I) فائقة الدقة (UHR)، وهي مصممة لتحسين قدرة نماذج الانتشار على توليف التفاصيل الدقيقة، وتمثيل تنوع المحتوى، وتحسين دقة الصورة. تحتوي مجموعة البيانات على ما يقارب 100,000 صورة فائقة الدقة، تغطي مجموعة واسعة من المواضيع، بما في ذلك الأشخاص والعمارة. تتجاوز دقة كل صورة 3K، وهي مزوّدة بأوصاف نصية غنية وعالية الجودة.
الاستخدام المباشر:https://go.hyper.ai/I3Fwl

4. بيانات نمط الحياة
بيانات نمط الحياة هي مجموعة بيانات شاملة لسلوكيات الصحة واللياقة البدنية، مصممة لتوفير قاعدة بيانات عالية الجودة لأنظمة توصيات الصحة الشخصية، وتحليل التمارين الرياضية، ونمذجة التنبؤ بنمط الحياة. تدمج هذه المجموعة معلومات عن الأفراد عبر أبعاد متعددة، بما في ذلك النظام الغذائي اليومي، والتمارين الرياضية، والمؤشرات الفسيولوجية، وتركيب الجسم، وتُعرض بصيغة جدول مُهيكل (CSV) مع حقول كاملة تغطي متغيرات متعددة المستويات، مثل الخصائص الفردية، والأداء الرياضي، والنظام الغذائي، وسلوك اللياقة البدنية.
الاستخدام المباشر:https://go.hyper.ai/SGK9K
5. مجموعة بيانات مخاطر الزلازل والتسونامي العالمية
إن تقييم مخاطر الزلازل والتسونامي العالمية عبارة عن مجموعة بيانات عالمية لتقييم مخاطر الزلازل والتسونامي، وهي مصممة لتوفير أساس بيانات موحد وقابل للحساب للتنبؤ بمخاطر التسونامي، وتحليل أحداث الزلزال، وتقييم مخاطر الزلازل.
الاستخدام المباشر:https://go.hyper.ai/a9Nrz
6. مجموعة بيانات تقييم توزيع الكلام ShiftySpeech
ShiftySpeech هو معيار واسع النطاق للكشف عن الكلام التركيبي، أصدرته جامعة جونز هوبكنز. يهدف إلى دراسة قدرة نماذج الكشف عن الكلام التركيبي على التعميم في العالم الحقيقي عند مواجهة "انحراف التوزيع" (بما في ذلك التغيرات في اللغة، والمتحدث، ونموذج التوليد، وظروف التسجيل).
الاستخدام المباشر:https://go.hyper.ai/YMKSP
7. مجموعة بيانات معيار إنتاجية APEX AI
APEX هي مجموعة بيانات مرجعية شاملة أصدرها فريق أبحاث ميركور بالتعاون مع كلية الحقوق بجامعة هارفارد ومعهد سكريبس للأبحاث. تُستخدم هذه المجموعة لتقييم أداء نماذج الذكاء الاصطناعي المتطورة في الأعمال المعرفية عالية القيمة الاقتصادية. وتهدف إلى قياس أداء نماذج الذكاء الاصطناعي المتطورة في المهام الاقتصادية الواقعية، بدلاً من الاكتفاء بالاستدلال المجرد.
الاستخدام المباشر:https://go.hyper.ai/3E2on

8. مجموعة بيانات معيارية للمهام الأساسية متعددة اللغات من Multi-LMentry
Multi-LMentry هي مجموعة بيانات مرجعية متعددة اللغات، مصممة لتقييم قدرة نماذج اللغات الكبيرة (LLMs) على التعميم بين اللغات بشكل منهجي، وذلك لفهم اللغات منخفضة المستوى ومهام التفكير المنطقي الأساسية في بيئات متعددة اللغات. تغطي مجموعة البيانات تسع لغات، بما في ذلك الإنجليزية والألمانية. يُعاد تصميم المهام يدويًا بواسطة متحدثين أصليين، وهي مشابهة في شكلها لإطار عمل LMentry الأصلي، ولكن دون ترجمة مباشرة، لضمان سلاسة وتوافقها الثقافي.
الاستخدام المباشر:https://go.hyper.ai/o2uJC
9. مجموعة بيانات تحرير الفيديو Ditto-1M الموجهة بالتعليمات
Ditto-1M هي مجموعة بيانات لتحرير الفيديو تعتمد على التعليمات، طورتها جامعة هونغ كونغ للعلوم والتكنولوجيا بالتعاون مع مجموعة Ant وجامعة تشجيانغ ومؤسسات أخرى. تهدف إلى تعزيز تطوير نماذج لتحرير الفيديو تعتمد على تعليمات اللغة الطبيعية، وتحسين فهم النموذج للتعليمات المعقدة، ودقة إنتاج الفيديو من خلال عينات تركيبية عالية الجودة وواسعة النطاق.
الاستخدام المباشر:https://go.hyper.ai/o2uJC

10. بيانات أداء المفاعل الكيميائي Reac-Discoveryتعيين
Reac-Discovery، التي أصدرتها جامعة جومي الأول، هي مجموعة بيانات لتصميم مفاعلات التدفق المعتمدة على الذكاء الاصطناعي وتحسين أداء التفاعل. تُولّد هذه المجموعة تلقائيًا أثناء التجارب باستخدام منصة Reac-Discovery التي طورها الفريق ذاتيًا، دون الحاجة إلى أي مصادر بيانات خارجية متاحة للجمهور. تغطي مجموعة البيانات ثلاث فئات من البيانات: الهندسة، وقابلية الطباعة، وأداء التفاعل، وهي تتوافق مع وحدات Reac-Gen وReac-Fab وReac-Eval الوظيفية للمنصة.
الاستخدام المباشر:https://go.hyper.ai/bMxVY
دروس تعليمية عامة مختارة
١. DeepSeek-OCR: "الضغط البصري" يحل محل التعرف التقليدي على الحروف
DeepSeek-OCR، الذي أصدرته شركة DeepSeek Inc.، هو دراسة أولية حول جدوى ضغط السياقات الطويلة من الصور. تُظهر التجارب أنه عندما لا يتجاوز عدد رموز النصوص 10 أضعاف عدد الرموز المرئية (أي نسبة ضغط أقل من 10x)، يمكن للنموذج تحقيق دقة فك تشفير (OCR) تبلغ 971 TP3T. حتى عند نسبة ضغط 20x، تظل دقة OCR حوالي 601 TP3T.
تشغيل عبر الإنترنت:https://go.hyper.ai/wmghV

2. Nanonets-OCR2-3B: تفسير أكثر دقة للعناصر المرئية في المستندات المعقدة
Nanonets-OCR2-3B هو نموذج تحويل الصور إلى Markdown من إنتاج Nanonets. لا يقتصر دور Nanonets-OCR2-3B على تحويل المستندات إلى Markdown مُهيكل، بل يُتيح أيضًا الاستفادة من التعرّف الذكي على المحتوى، والوسم الدلالي، والإجابة البصرية على الأسئلة المُراعية للسياق، مما يُتيح فهمًا أعمق وتفسيرًا أدق للمستندات المُعقدة.
تشغيل عبر الإنترنت: https://go.hyper.ai/3DWbb

3. نشر Yolov13 بنقرة واحدة
YOLOv13 هو نموذج لاكتشاف الأجسام، اقترحه فريق بحثي مشترك من جامعة تسينغهوا، وجامعة تاييوان للتكنولوجيا، وجامعة شيان جياوتونغ، وجامعات أخرى. بناءً على مزايا الكشف الفوري في سلسلة YOLO، يُقدم هذا النموذج سلسلة من الآليات الجديدة، مثل تحسين الرسم البياني الفائق، والنمذجة الدلالية عالية المستوى، وإعادة بناء الهياكل البسيطة. يحقق هذا النموذج ريادة شاملة في مجموعات البيانات الرئيسية مثل MS COCO وPascal VOC، مما يُظهر قدرة تعميمية أقوى وتطبيقًا عمليًا.
تشغيل عبر الإنترنت:https://go.hyper.ai/PAcy1

💡لقد قمنا أيضًا بتأسيس مجموعة تبادل تعليمية حول الانتشار المستقر. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة والتعليق على [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق ~

توصيات الورقة البحثية لهذا الأسبوع
1. كل تنشيط مُعزز: توسيع نطاق المُبرر العام إلى تريليون مؤسسة اللغة المفتوحة
تُقدّم هذه المقالة نموذج Ling 2.0، وهو نموذج أساسي للغة لمهام الاستدلال المتسلسلة، مبني على المبدأ الأساسي المتمثل في "تعزيز القدرة على الاستدلال مع كل تفعيل". باستخدام بنية مزيج الخبراء الموحد (MoE)، يُمكن لهذا النموذج التوسع من مليارات إلى تريليونات من المعلمات، مع التركيز على الندرة العالية، والاتساق بين المقاييس، والكفاءة المُسترشدة بقوانين التوسع التجريبية.
رابط الورقة:https://go.hyper.ai/O4pRV
٢. ThinkMorph: الخصائص الناشئة في التفكير المتشابك متعدد الوسائط
يقوم هذا البحث ببناء ThinkMorph - وهو نموذج موحد تم ضبطه بدقة على 24000 مسار استدلال متداخل عالي الجودة، ويغطي مجموعة متنوعة من المهام بمستويات متفاوتة من المشاركة البصرية، وقادر على توليد خطوات استدلال نصية بيانية متقدمة تدريجيًا، والحفاظ على المنطق الدلالي المتماسك أثناء التلاعب بالمحتوى المرئي.
رابط الورقة:https://go.hyper.ai/AGtSS
3. لا تُعمي VLA الخاص بك: محاذاة التمثيلات المرئية لتعميم OOD
تناولت هذه الدراسة بشكل منهجي الحفاظ على التمثيلات أثناء الضبط الدقيق لنماذج الرؤية واللغة والفعل (VLA)، ووجدت أن الضبط الدقيق للفعل المباشر يؤدي إلى تراجع في أداء التمثيل البصري. ولتحديد هذا التأثير وقياسه، استكشف الباحثون التمثيلات الخفية لنماذج VLA وحللوا خرائط انتباهها. علاوة على ذلك، صُممت سلسلة من المهام والأساليب المحددة لمقارنة نماذج VLA بنماذج VLM المقابلة لها، وبالتالي عزل التغيرات في القدرة البصرية-اللغوية الناتجة عن الضبط الدقيق للفعل.
رابط الورقة:https://go.hyper.ai/xNU6P
4. OS-Sentinel: نحو وكلاء واجهة مستخدم رسومية مُحسّنين للسلامة عبر التحقق الهجين في سير العمل الواقعية
تقترح هذه الورقة إطار عمل جديد للكشف عن الأمان الهجين، OS-Sentinel، والذي يكتشف بشكل تعاوني انتهاكات صريحة على مستوى النظام من خلال أداة تحقق رسمية، بينما يقوم في الوقت نفسه بتقييم المخاطر السياقية وسلوكيات الوكيل باستخدام قاضي سياقي يعتمد على VLM.
رابط الورقة:https://go.hyper.ai/bG6b5
5. VCode: معيار ترميز متعدد الوسائط مع SVG كتمثيل بصري رمزي
تقترح هذه الورقة البحثية VCode، وهو إطار عمل مرجعي يُعيد هيكلة الفهم متعدد الوسائط إلى مهمة توليد شيفرة: عند وجود صورة، يجب على النموذج توليد شيفرة SVG تحافظ على الدلالات الرمزية لدعم الاستدلال اللاحق. يغطي الإطار ثلاثة مجالات: الفهم السليم العام (MM-Vet)، والمعرفة الخاصة بالموضوع (MMMU)، والمهام التي تركز على الإدراك البصري (CV-Bench).
رابط الورقة:https://go.hyper.ai/UNmqK
مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:https://go.hyper.ai/iSYSZ
تفسير مقالة المجتمع
في أكتوبر 2025، ظهر ديميس هاسابيس، الرئيس التنفيذي لشركة جوجل ديب مايند، على غلاف قائمة مجلة تايم لأفضل 100 شخصية. من ألفاغو إلى ألفا فولد، التزم هاسابيس بالتوجه العلمي لـ AI4S، ولكن مع اندماج ديب مايند مع جوجل، انتقدت العديد من وسائل الإعلام طموحات ديب مايند التجارية وخلافاتها الأخلاقية.
شاهد التقرير الكامل:https://go.hyper.ai/vSqZI
يحقق NeuTTS-Air، أحدث نموذج توليف كلامي شامل ومفتوح المصدر من Neuphonic، أداءً متطورًا (SOTA) مقارنةً بالنماذج مفتوحة المصدر، لا سيما في معايير التوليف فائقة الواقعية والاستدلال الفوري. كما يُمكنه التعميم على سيناريوهات جديدة مثل العوامل المُدمجة ونقل الأنماط، ويدعم استنساخ الصوت لمدة 3 ثوانٍ، ويُولّد محتوى حواريًا طبيعيًا.
شاهد التقرير الكامل:https://go.hyper.ai/5kAIi
اقترح فريق مشترك من المعهد الفيدرالي السويسري للتكنولوجيا في زيورخ، ومعهد كاليفورنيا للتكنولوجيا، وجامعة ألبرتا، إطار عمل للتعلم العميق يُسمى NOBLE. وهو أول إطار عمل واسع النطاق للتعلم العميق يُثبت أدائه باستخدام بيانات تجريبية من قشرة الدماغ البشرية، ولأول مرة، يتعلم مباشرةً الديناميكيات غير الخطية للخلايا العصبية من البيانات التجريبية، محققًا سرعات محاكاة أسرع بـ 4200 مرة من الحلول العددية التقليدية.
شاهد التقرير الكامل:https://go.hyper.ai/oQ74B
أسسها ثلاثة طلاب لم يتجاوزوا الثانية والعشرين من عمرهم، ولم يتبقَّ لهم سوى 22 عامًا، وجمعت ميركور 350 مليون دولار أمريكي في جولة التمويل الثالثة (Series C) في أقل من ثلاث سنوات، وارتفعت قيمتها السوقية إلى 10 مليارات دولار أمريكي. وتُقلِّل الشركة كفاءة التوظيف التقليدية إلى ثوانٍ معدودة من خلال نموذج التوظيف المُدعَّم بالذكاء الاصطناعي، وأطلقت معيار APEX، مُقدِّمةً بذلك معيارًا جديدًا لتقييم القيمة الاقتصادية للذكاء الاصطناعي.
شاهد التقرير الكامل:https://go.hyper.ai/kBj1w
٥. حل تحدي النمذجة على المستوى الذري لتباين تكوين البروتين! تحليل إطار عمل PLACER لفريق ديفيد بيكر
قام فريق بحثي بقيادة البروفيسور ديفيد بيكر من جامعة واشنطن بتطوير شبكة عصبية بيانية تسمى PLACER، والتي يمكنها توليد هياكل جزيئات عضوية صغيرة مختلفة بدقة استنادًا إلى التركيب الذري ومعلومات الرابطة للجزيئات الصغيرة؛ ونظرًا للبنية العيانية للبروتينات، يمكنها بناء الهياكل التفصيلية للجزيئات الصغيرة والسلاسل الجانبية للبروتين لمهام الالتحام بين الجزيئات الصغيرة.
شاهد التقرير الكامل:https://go.hyper.ai/sisqO
مقالات موسوعية شعبية
1. دال-إي
2. الشبكات الفائقة
3. جبهة باريتو
4. الذاكرة طويلة المدى ثنائية الاتجاه (Bi-LSTM)
5. اندماج الرتب المتبادلة
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
الموعد النهائي للقمة في نوفمبر

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!