Command Palette
Search for a command to run...
FLUX.2-klein-4B: يحقق توليد الصور في أقل من ثانية واحدة من خلال التقطير، مما يتيح التفاعل في الوقت الحقيقي على وحدات معالجة الرسومات من الدرجة الاستهلاكية؛ مجموعة بيانات المركبات OpenImages: تركز على اكتشاف المركبات وتحديد موقعها.

في الوقت الحالي، ورغم أن نماذج توليد الصور السائدة قادرة على إنتاج نتائج عالية الجودة، إلا أنها تعاني من بطء سرعة الاستدلال، ومتطلبات الذاكرة العالية، ونمط التفاعل الذي لا يزال عالقًا في عصر "الأدوات غير المتصلة بالإنترنت". لا يمكن للمستخدمين سوى الانتظار بشكل سلبي بعد إدخال المطالبات، ولا يمكنهم تحقيق استجابة وتفاعل في الوقت الفعلي.هذا يحد من تطبيق الذكاء الاصطناعي في سيناريوهات مثل التصميم في الوقت الفعلي والنماذج الأولية السريعة.
وفي هذا السياق،أصدرت شركة Black Forest Labs نموذج FLUX.2-klein-4B مفتوح المصدر، والذي يضغط خطوات الاستدلال إلى 4 خطوات من خلال التقطير التدريجي، مما يحقق استدلالًا من طرف إلى طرف في أقل من ثانية (≤0.5 ثانية).يدعم تصميمه الموحد تحويل النصوص إلى صور، وتحويل الصور إلى صور، وإنشاء مراجع متعددة، مما يُغني عن عناء التبديل بين نماذج متعددة. ولا يتطلب سوى حوالي 13 جيجابايت من ذاكرة الفيديو ليعمل بكفاءة على وحدات معالجة الرسومات الاستهلاكية، كما يدعم تقنية التكميم FP8/NVFP4، مما يزيد السرعة بمقدار يصل إلى 2.7 ضعف. يحوّل هذا النظام توليد الصور بالذكاء الاصطناعي من أداة معقدة تعمل دون اتصال بالإنترنت إلى أداة تفاعلية سريعة الاستجابة، موفرًا حلاً خفيفًا وفعالًا لسيناريوهات مثل التصميم الفوري والتحرير التفاعلي.
يعرض موقع HyperAI الآن "FLUX.2-klein-4B: نموذج عالي السرعة لتوليد الصور"، لذا جربه!
الاستخدام عبر الإنترنت:https://go.hyper.ai/N7D6c
نظرة سريعة على تحديثات الموقع الرسمي لشركة hyper.ai من 26 يناير إلى 30 يناير:
* مجموعات البيانات العامة عالية الجودة: 7
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 6
* الأوراق البحثية الموصى بها لهذا الأسبوع: 5
* تفسير المقالات المجتمعية: 5 مقالات
* إدخالات الموسوعة الشعبية: 5
أهم المؤتمرات التي تنتهي مواعيدها في فبراير: 6
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات صور المركبات OpenImages
تستند مجموعة بيانات OpenImages الخاصة بالمركبات إلى مجموعة بيانات OpenImages العامة واسعة النطاق من Google، وتركز على اكتشاف المركبات وتحديد مواقعها، بهدف دعم التدريب السريع والفعال لنماذج اكتشاف المركبات.
الاستخدام المباشر:https://go.hyper.ai/Y8nUj

2. مجموعة بيانات الأشعة السينية للصدر لالتهاب الرئة
مجموعة بيانات "التهاب الرئة بالأشعة السينية للصدر" هي مجموعة بيانات تتضمن خصائص رقمية مستخرجة من صور الأشعة السينية للصدر. تدعم هذه المجموعة التحليل الإحصائي والتعلم الآلي التقليدي من خلال تحويل كل صورة إلى خصائص رقمية منظمة، بما في ذلك إحصائيات الكثافة العامة، ومُعرّفات النسيج (GLCM)، وخصائص مجال التردد (FFT)، والمقاييس القائمة على الحواف، وخصائص نمط الثنائيات المحلية (LBP).
الاستخدام المباشر:https://go.hyper.ai/RNgZD
3. مرض السكري في المكسيك (مجموعة بيانات مرض السكري في المكسيك)
يُعدّ مشروع "داء السكري في المكسيك" مجموعة بيانات خاصة بمرض السكري، أصدرها المعهد الوطني للصحة العامة في المكسيك. ويستند هذا المشروع إلى بيانات من المسح الوطني للصحة والتغذية لعام 2024، ويهدف إلى تقييم خصائص المخاطر الأيضية المرتبطة بمرض السكري لدى السكان المكسيكيين.
الاستخدام المباشر:https://go.hyper.ai/2L4uw
4. مؤشر جودة الهواء لتلوث دلهي (مجموعة بيانات جودة الهواء في دلهي)
مؤشر جودة الهواء لتلوث دلهي هو مجموعة بيانات بيئية لتحليل جودة الهواء والتنبؤ بها. توفر هذه المجموعة بيانات جودة الهواء والبيئة كل ساعة للمدن الرئيسية في منطقة دلهي الكبرى، وهي مناسبة لتحليل التلوث والتنبؤ بالسلاسل الزمنية وتطبيقات التعلم الآلي.
الاستخدام المباشر:https://go.hyper.ai/cNuok
5. مجموعة بيانات LightOnOCR-mix-0126 لنسخ النصوص
LightOnOCR-mix-0126 عبارة عن مجموعة بيانات واسعة النطاق لنسخ النصوص بتقنية التعرف الضوئي على الحروف (OCR) تم إصدارها بواسطة LightOn، وهي مصممة لتوفير الإشراف على نماذج التعرف الضوئي على الحروف (OCR) وفهم المستندات من البداية إلى النهاية، وإخراج نص منسوخ بترتيب طبيعي لصفحة كاملة.
الاستخدام المباشر:https://go.hyper.ai/tZRlI
6. إشارة السونار (مجموعة بيانات إشارة السونار تحت الماء)
مجموعة بيانات إشارات السونار هي مجموعة بيانات لإشارات السونار تُستخدم لتصنيف الأجسام تحت الماء. هذه المجموعة مناسبة لمهام التصنيف الثنائي، بهدف التمييز بين ما إذا كانت إشارة السونار صادرة عن صخور أو منجم.
الاستخدام المباشر:https://go.hyper.ai/uXIom
7. مجموعة بيانات مُصنّفة لإيماءات اليد للعبة سيارات
مجموعة بيانات Hand Gestures Labbled هي مجموعة بيانات صور لألعاب السيارات تعتمد على الإيماءات، مصممة لتدريب نماذج التعلم الآلي للتحكم في ألعاب السيارات باستخدام الإيماءات. تحتوي مجموعة البيانات على 330 صورة موزعة على أربع فئات من الإيماءات: يسار، حركة للأمام والخلف، يمين، وتوقف.
الاستخدام المباشر:https://go.hyper.ai/sZmIc
دروس تعليمية عامة مختارة
1. WeDLM: إطار عمل عالي الكفاءة لفك تشفير نماذج اللغة الكبيرة
WeDLM (فك التشفير الفعال القائم على النوافذ للنماذج الكبيرة) هو إطار عمل عالي الكفاءة لفك تشفير نماذج اللغة الكبيرة، أطلقته شركة Tencent، وهو مصمم لتزويد أنظمة حوار الذكاء الاصطناعي من الجيل التالي بقدرات فائقة السرعة والذكاء والتكيف في توليد اللغة. يستخدم هذا الإطار بنية فك تشفير متوازية مبتكرة قائمة على النوافذ، مما يحقق تحسنًا ملحوظًا في سرعة فك التشفير مع الحفاظ على جودة عالية في توليد النصوص. يكمن جوهر هذا الإنجاز التقني في دمج آليات اتخاذ القرار القائمة على عتبة الإنتروبيا وآليات الجزاء الموضعي، مما يحل بفعالية مشكلة عنق الزجاجة في السرعة التي تعاني منها عمليات فك التشفير التراجعي التقليدية عند توليد تسلسلات طويلة.
تشغيل عبر الإنترنت:https://go.hyper.ai/Cfahp

2. FLUX.2-klein-4B: نموذج توليد صور فائق السرعة
يُعدّ FLUX.2-klein-4B أحدث نموذج فائق السرعة لتوليد الصور من شركة Black Forest Labs. يعتمد هذا النموذج على بنية Rectified-Flow، ويستخدم تصميم Transformer مُبسّطًا بأربعة مليارات مُعامل، جامعًا بين إمكانيات تحرير الصور النصية والصور متعددة المراجع ضمن حجم نموذج صغير. لا يتطلب سوى حوالي 13 جيجابايت من ذاكرة وحدة معالجة الرسومات، ويمكنه تحقيق سرعات استدلال شاملة تقل عن ثانية واحدة على وحدات معالجة الرسومات المُخصصة للمستهلكين.
تشغيل عبر الإنترنت:https://go.hyper.ai/N7D6c

3. عامل التشخيص DiagGym
يُعدّ DiagAgent، وهو وكيل تشخيصي (7B، 8B، 14B) طوّره فريق AI4Med في جامعة شنغهاي جياو تونغ ومختبر شنغهاي للذكاء الاصطناعي، أداةً فعّالة لإدارة مسار التشخيص، حيث يختار الفحوصات الأكثر فائدة، ويحدد وقت إيقافها، ويُقدّم تشخيصًا نهائيًا دقيقًا. على عكس النماذج الطبية التقليدية واسعة النطاق التي تُقدّم إجابةً واحدةً فقط، يُمكن لـ DiagAgent التوصية بالفحوصات المناسبة وتحديث التشخيص بشكلٍ مُتكيف في حوارات مُتعددة المراحل، ولا يُقدّم تشخيصًا نهائيًا إلا بعد الحصول على معلومات كافية. تمّ تحسين DiagAgent في بيئة DiagGym من خلال التعلّم المُعزّز متعدد المراحل الشامل (GRPO). في كل تفاعل، يبدأ الوكيل باستشارة أولية، ويتفاعل مع DiagGym من خلال التوصية بالفحوصات وتلقّي نتائج المحاكاة، ويُحدّد وقت تقديم التشخيص النهائي.
تشغيل عبر الإنترنت:https://go.hyper.ai/FzOau

4. نظام Pocket-TTS: نظام تحويل النص إلى كلام عالي الجودة وخفيف الوزن للبث المباشر
Pocket-TTS هو نموذج توليف كلامي فائق الخفة أصدرته شركة Kyutai Labs. يركز هذا النموذج على زمن استجابة منخفض وإخراج متدفق، بهدف توفير إمكانيات توليد كلام عالية الجودة للبيئات ذات الموارد المحدودة أو السيناريوهات التي تتطلب تفاعلاً في الوقت الفعلي (مثل مساعدي الذكاء الاصطناعي).
تشغيل عبر الإنترنت:https://go.hyper.ai/CwgHo

5. برنامج تعليمي لمترجم تريتون
Triton هي لغة ومترجم للبرمجة المتوازية، مصممة لتوفير بيئة برمجة قائمة على لغة Python لكتابة نوى حساب DNN مخصصة بكفاءة والتي يمكن تشغيلها بأقصى إنتاجية على أجهزة GPU.
تشغيل عبر الإنترنت:https://go.hyper.ai/Xqd8j
6. برنامج تعليمي TVM الإصدار 0.22.0
Apache TVM هو إطار عمل مفتوح المصدر لمترجم التعلم الآلي لوحدات المعالجة المركزية ووحدات معالجة الرسومات ومسرعات التعلم الآلي، وهو مصمم لتمكين مهندسي التعلم الآلي من تحسين وتشغيل العمليات الحسابية بكفاءة على أي واجهة خلفية للأجهزة.
تشغيل عبر الإنترنت:https://go.hyper.ai/s3yot
توصيات الورقة البحثية لهذا الأسبوع
1. مكافأة النادر: التعلم المعزز الواعي بالتفرد لحل المشكلات الإبداعية في برامج الماجستير في القانون
تقترح هذه الورقة البحثية طريقةً للتعلم المعزز تراعي التفرد. تصمم هذه الطريقة دالة هدف على مستوى التوزيع، وتكافئ استراتيجيات الاستدلال النادرة عالية المستوى من خلال إعادة ترجيح حجم التجميع والتجميع العكسي بناءً على نموذج لغوي كبير (LLM). يُحسّن هذا بشكل ملحوظ تنوع الحلول وأداء اختبار النجاح (pass@k) في معايير الاستدلال الرياضي والفيزيائي والطبي، دون التأثير على أداء اختبار النجاح (pass@1).
رابط الورقة:https://go.hyper.ai/k5A3R
2. DeepResearchEval: إطار عمل آلي لبناء مهام البحث المعمق والتقييم الآلي
تقترح هذه الورقة البحثية DeepResearchEval، وهو إطار عمل آلي يُولّد مهام بحثية معمقة واقعية ومعقدة من خلال مناهج قائمة على الأدوار، ويستخدم آليات تقييم جودة تكيفية خاصة بكل مهمة، بالإضافة إلى آليات استباقية للتحقق من الحقائق، لتقييم الوكلاء بناءً على نماذج لغوية ضخمة. يتيح ذلك التحقق من الادعاءات دون الحاجة إلى مراجع، مما يُمكّن من إجراء تقييم موثوق لأنظمة البحث الشبكي متعددة المراحل.
رابط الورقة:https://go.hyper.ai/b92V4
3. التطور الذاتي المتحكم به لتحسين الكود الخوارزمي
تقترح هذه الورقة البحثية طريقةً للتطور الذاتي المُتحكم به (CSE)، تُحسّن كفاءة توليد الشفرة من خلال تمكين إعادة استخدام الخبرة عبر تهيئة متنوعة، وعمليات جينية موجهة بالتغذية الراجعة، وذاكرة هرمية. وتحقق هذه الطريقة استكشافًا فعالًا وتحسينًا مستمرًا لشبكات LLM الأساسية المختلفة على معيار EffiBench-X.
رابط الورقة:https://go.hyper.ai/RJHUC
4. MMFormalizer: الصيغة التلقائية متعددة الوسائط في بيئات العمل الحقيقية
تقترح هذه الورقة البحثية MMFORMALIZER، وهو إطار عمل جديد متعدد الوسائط للصياغة التلقائية يجمع بين التحديد التكيفي للموقع والبدائيات الإدراكية لبناء مقترحات بشكل متكرر مع أسس رسمية في البديهيات الرياضية والفيزيائية، مما يتيح الاستدلال الآلي في مجالات مثل الميكانيكا الكلاسيكية والنسبية وميكانيكا الكم والديناميكا الحرارية، ويوضح قابلية التوسع على معيار PHYX-AF.
رابط الورقة:https://go.hyper.ai/mC7NC
5. ماكس: الاستكشاف التكيفي الفائق باستخدام وكلاء LLM
تقترح هذه الورقة البحثية إطار عمل MAXS، وهو إطار استدلال تكيفي فائق لوكلاء نماذج اللغة الكبيرة (LLM). من خلال إدخال آليات التخطيط الاستباقي وتقارب المسار، يُخفف هذا الإطار من مشكلات قصر النظر المحلي وعدم استقرار الاستدلال. وبالجمع بين تقدير الميزة واختيار حجم الخطوة القائم على الاتساق، يحقق استدلالًا متعدد الأدوات فعالًا ومستقرًا وعالي الأداء.
رابط الورقة:https://go.hyper.ai/Wrhke
تفسير مقالة المجتمع
1. من مولتروب إلى عوائد السياسات، هل يمكن لشركة "ذكاء اصطناعي لشخص واحد" تقف في طليعة هذا الاتجاه أن تنمو لتصبح مؤسسة كبيرة وقوية؟
مع تزايد انتشار الأدوات التكنولوجية مثل ChatGPT، وأدوات تصميم الذكاء الاصطناعي، وأنظمة تحليل البيانات الذكية، يشهد عالم الشركات الناشئة ثورةً غير مسبوقة في الكفاءة. يُنظر إلى Clawdbot (الذي أعيدت تسميته لاحقًا إلى Moltrbot)، والذي انتشر مؤخرًا على نطاق واسع، على أنه مساعد شخصي مفتوح المصدر مُهيأ لإحداث نقلة نوعية في الإنتاجية بحلول عام 2026. وقد أصبح هذا المساعد الذكي، الذي يُوصف بأنه "حاصل على ماجستير في القانون من الطراز الأول مزود بأيدٍ عاملة"، حديث وادي السيليكون، حيث ارتفع عدد نجومه على GitHub إلى 57.5 ألف نجمة في ثلاثة أيام فقط من إطلاقه. والأهم من ذلك، أن هذا الشكل الجديد من الشركات الناشئة حظي بدعم سياسي إيجابي. ففي عام 2016، شجعت "آراء مجلس الدولة بشأن تعزيز التنمية المستدامة والصحية لرأس المال المخاطر" صراحةً الأفراد ذوي القدرة المالية والخبرة الإدارية على الانخراط في أنشطة رأس المال المخاطر من خلال تأسيس شركات فردية بشكل قانوني.
شاهد التقرير الكامل:https://go.hyper.ai/2hKRe
2. جمعت شركة Skild AI، وهي شركة ناشئة في مجال الروبوتات، 1.4 مليار دولار بمشاركة من SoftBank وNvidia وSequoia Capital وBezos، من بين آخرين، لتطوير نماذج أساسية للأغراض العامة.
في منتصف يناير 2026، أعلنت شركة Skild AI الناشئة في مجال الروبوتات عن إتمام جولة تمويل من الفئة C بقيمة تقارب 1.4 مليار دولار، مما رفع قيمة الشركة إلى أكثر من 14 مليار دولار. قادت هذه الجولة مجموعة سوفت بنك اليابانية، بمشاركة مستثمرين استراتيجيين من بينهم NVentures التابعة لشركة Nvidia، وMacquarie Capital، وBezos Expeditions (التي أسسها جيف بيزوس، مؤسس أمازون). كما شاركت في الجولة شركات سامسونج، وإل جي، وشنايدر إلكتريك، وسيلزفورس فنتشرز. في وقت لا تزال فيه أجهزة الروبوتات قيد التطوير، وتظل تطبيقاتها متفرقة للغاية، تدفقت رؤوس الأموال بشكل متكرر ومتزامن تقريبًا إلى عدد قليل من الشركات التي لا تقتصر على تصنيع الروبوتات فقط. يعكس هذا، إلى حد ما، طبيعة رأس المال القائمة على الربح، ويؤكد أن هذه الشركة الناشئة، التي لم يتجاوز عمرها ثلاث سنوات، قد اختارت مسارًا واعدًا.
شاهد التقرير الكامل:https://go.hyper.ai/iYHbK
3. يتصدر برنامج AlphaGenome غلاف مجلة Nature! ويتنبأ بتأثيرات التباين عبر جميع الوسائط وأنواع الخلايا في أقل من ثانية واحدة.
في يونيو 2025، أطلقت جوجل ديب مايند نموذج ألفا جينوم. يستقبل هذا النموذج تسلسلات الحمض النووي (DNA) التي يصل طولها إلى مليون زوج قاعدي كمدخلات، ويتنبأ بآلاف الخصائص الجزيئية المتعلقة بأنشطتها التنظيمية. كما يمكنه تقييم تأثير التغيرات أو الطفرات الجينية من خلال مقارنة تنبؤات التسلسلات المتحولة وغير المتحولة. ومن أبرز إنجازات ألفا جينوم قدرته على "التنبؤ المباشر بمواقع الربط من التسلسلات واستخدامها للتنبؤ بتأثير التغيرات". علّق الدكتور كاليب لارو من مركز ميموريال سلون كيترينج للسرطان قائلاً: "هذا إنجازٌ بارز في هذا المجال. فللمرة الأولى، لدينا نموذج يجمع بين فهم السياق الطويل، ودقة القاعدة الواحدة، والأداء المتميز، ليغطي نطاقًا واسعًا من المهام الجينومية".
شاهد التقرير الكامل:https://go.hyper.ai/jgO8K
4. استنادًا إلى مليارات الجينات من مليون نوع، قامت NVIDIA وغيرها ببناء سلسلة نماذج EDEN، محققة قدرات التنبؤ بالجينوم والبروتين المتطورة (SOTA).
يتمثل الهدف الأساسي لعلم الأحياء القابل للبرمجة في تحقيق تصميم عقلاني وتنظيم دقيق للأنظمة الحية، مما يُسهم في تطوير علاجات ثورية للأمراض المعقدة. إلا أن هذه العملية لطالما كانت محدودة بسبب التعقيد المتأصل في الأنظمة البيولوجية، حيث أن قدرتها على التعميم غير كافية بشكل كبير عند تصميم علاجات مبتكرة متعددة الأنماط والمستويات. وللتغلب على هذا القيد الأساسي، قامت شركة Basecamp Research وشركة NVIDIA والعديد من المؤسسات الأكاديمية الرائدة بتطوير سلسلة EDEN من النماذج الأساسية للميتاجينوم.
شاهد التقرير الكامل:https://go.hyper.ai/jPS42
5. قامت جامعة كاليفورنيا ببناء مطياف على رقاقة يعتمد على شبكة عصبية متصلة بالكامل، مما يحقق دقة طيفية تبلغ 8 نانومتر على مستوى الرقاقة.
دخلت كاميرات الهواتف الذكية اليوم عصر الميغابكسل، إلا أنها لا تزال عاجزة عن تحليل التركيب الكيميائي للمواد كما تفعل أجهزة قياس الطيف الاحترافية. يكمن جوهر هذه الفجوة في غياب عنصر أساسي في الهواتف الذكية وغيرها من الأجهزة، ألا وهو جهاز قياس الطيف، القادر على قراءة "البصمة الطيفية" الفريدة للمادة بدقة. تعمل أجهزة قياس الطيف التقليدية، باعتبارها أدوات مهمة لتحليل المواد، عن طريق فصل الضوء المركب إلى أطياف ذات أطوال موجية مختلفة، ثم تحديد تركيب المادة من خلال خطوط طيفية مميزة. مع ذلك، تواجه هذه الأجهزة تحديًا كبيرًا: فالتصغير يستلزم التخلي عن الهياكل التشتيتية التقليدية؛ ولكن كيف يمكن الحصول على المعلومات الطيفية بدون هذه الهياكل؟ ولمعالجة هذا التحدي، اقترح فريق بحثي في جامعة كاليفورنيا حلاً مبتكرًا: تصميم بنية نسيجية خاصة لاحتجاز الفوتونات (PTST) على سطح ثنائي ضوئي سيليكوني قياسي، وإدخال شبكة عصبية متصلة بالكامل ذات مقاومة عالية للتشويش.
شاهد التقرير الكامل:https://go.hyper.ai/bYwq8
مقالات موسوعية شعبية
1. معدل الإطارات في الثانية (FPS)
2. دمج الفرز العكسي RRF
3. نموذج اللغة المرئي (VLM)
4. الشبكات الفائقة
5. الانتباه المُوجَّه
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!








