HyperAI

قفزة نوعية في القدرة على التفكير! GLM-4.1V - التفكير يُعزز تطور الذكاء المعرفي؛ 5 ملايين مثال لبيانات التفكير خطوة بخطوة! MathX-5M يفتح آفاقًا جديدة في التفكير الرياضي.

特色图像

في الوقت الحاضر، تتطور النماذج الكبيرة متعددة الوسائط من "الذكاء الإدراكي" إلى "الذكاء المعرفي". وقد حاولت دراسات سابقة تعزيز القدرة على التفكير المنطقي في نماذج اللغة البصرية، إلا أن معظمها يقتصر على مجالات محددة. ورغم استمرار الأبحاث ذات الصلة، لا يزال هناك نقص في نموذج عالمي متعدد الوسائط للتفكير المنطقي.

في هذا السياق، اقترحت شركة Zhipu AI وجامعة تسينغهوا بشكل مشترك نموذج التفكير البصري GLM-4.1V (VLM)، المصمم لتعزيز الفهم والتفكير المتعدد الوسائط العام.ويتمثل الابتكار الأساسي في استراتيجية "التعلم المعزز باستخدام عينات من المناهج الدراسية (RLCS)".لا يحقق فقط أقوى أداء لنموذج اللغة المرئية على مستوى المعلمة 10B،في 18 من مهام القائمة، يحتوي Qwen-2.5-VL-72B على نفس المعلمات أو حتى أكثر من 8 مرات.كما أنها تحقق قفزة في القدرات المعرفية الديناميكية للنماذج متعددة الوسائط - الترقية من "التعرف على الصور" السلبي إلى "التفكير" النشط، وحل نقاط الألم في التفكير مع الحفاظ على مزايا النشر خفيف الوزن.

في الوقت الحاضر، أطلق الموقع الرسمي لـ HyperAI البرنامج التعليمي "GLM-4.1V-Thinking: Versatile Multimodal Reasoning through Scalable Reinforcement Learning"، تعال وجربه~

GLM-4.1V-التفكير: التفكير متعدد الوسائط المتنوع من خلال التعلم التعزيزي القابل للتطوير

الاستخدام عبر الإنترنت:https://go.hyper.ai/B3Vzs

من 7 يوليو إلى 11 يوليو، تحديثات الموقع الرسمي لـhyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 7

* الأوراق الموصى بها لهذا الأسبوع: 5

* تفسير المقالات المجتمعية: 5 مقالات

* إدخالات الموسوعة الشعبية: 5

* أفضل المؤتمرات مع الموعد النهائي في يوليو: 4

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات اكتشاف الطائرات بدون طيار VisDrone

VisDrone هي مجموعة بيانات مرجعية واسعة النطاق لكشف وتتبع الأهداف البصرية للطائرات بدون طيار، مصممة للمساعدة في تطوير وتقييم مهام الرؤية الحاسوبية، مثل كشف الأهداف وتتبع الأجسام وتجزئة الصور. تحتوي مجموعة البيانات على صور ومقاطع فيديو عالية الدقة جُمعت باستخدام طائرات بدون طيار في بيئات حضرية وضواحي مدن مختلفة في الصين، وتغطي ست فئات (مثل الأشخاص والمركبات والمباني والحيوانات، إلخ).

الاستخدام المباشر:https://go.hyper.ai/hQ5lh

مثال لمجموعة البيانات

2. مجموعة بيانات الاستدلال الرياضي MathX-5M

MathX هي مجموعة بيانات استدلال رياضي مصممة لضبط النماذج القائمة على التعليمات، وصقل النماذج الحالية لتعزيز قدرات التفكير. تُعد هذه المجموعة أكبر وأشمل قاعدة بيانات استدلال رياضي عامة حتى الآن، حيث تتضمن 5 ملايين مثال لبيانات التفكير خطوة بخطوة، مختارة بعناية، ويحتوي كل منها على: بيان المشكلة، وعملية استدلال مفصلة، وحل صحيح مُثبت.

الاستخدام المباشر:https://go.hyper.ai/h0eLq

3. تصنيف الفاكهة مجموعة بيانات صور تصنيف الفاكهة

تصنيف الفاكهة هو مجموعة بيانات لصور تصنيف الفاكهة، مصممة لتدريب نماذج التعلم الآلي والتعلم العميق على التعرف على الفاكهة وتصنيفها. تغطي مجموعة البيانات 101 نوعًا من الفاكهة، وتحتوي كل فئة على حوالي 400 صورة للتدريب، و50 صورة للتحقق، و50 صورة للاختبار.

الاستخدام المباشر:https://go.hyper.ai/a8gfG

عرض مجموعة البيانات

4. مجموعة بيانات صور سلالات الكلاب

صور سلالات الكلاب هي مجموعة بيانات لصور سلالات الكلاب، تحتوي على صور لسلالات مختلفة، مصممة للمساعدة في تدريب وتقييم نماذج تصنيف سلالات الكلاب. تحتوي هذه المجموعة على آلاف (أكثر من 17,000) صورة لسلالات كلاب مختلفة، أكثر من 100 سلالة (كلاب الترير، كلاب الصيد، كلاب الماستيف، كلاب السبانيل، كلاب البيشون فريز، إلخ)، مصممة للمساعدة في تطوير أنظمة التعرف على سلالات الكلاب.

الاستخدام المباشر:https://go.hyper.ai/DoFA3

مثال لمجموعة البيانات

5. أنواع الفطر مجموعة بيانات تحديد أنواع الفطر

الفطر هو مجموعة بيانات للتعرف على أنواع الفطر. تحتوي المجموعة على صور لأكثر من 100 نوع من الفطر. تتضمن البيانات الخصائص الفيزيائية لكل فطر، مثل اللون والشكل والرائحة وملمس السطح، وغيرها، وتوضح ما إذا كان سامًا أم صالحًا للأكل. تُظهر هذه الصور مورفولوجيا الفطر في مراحل نموه المختلفة وظروف نموه، مما يجعلها مثالية لمهام التصنيف الدقيقة.

الاستخدام المباشر:https://go.hyper.ai/ws0pi

عرض مجموعة البيانات

6. مجموعة بيانات تدريب تحويل النص إلى صورة (2 مليون)

Text-to-Image-2M هي مجموعة بيانات عالية الجودة لأزواج النصوص والصور، مصممة لضبط نماذج تحويل النص إلى صورة بدقة. تحتوي مجموعة البيانات على حوالي مليوني عينة، وهي مقسمة إلى مجموعتين فرعيتين أساسيتين: data_512_2M (مليونا صورة بدقة 512×512 مع تعليقات توضيحية) و data_1024_10K (10,000 صورة عالية الدقة بدقة 1024×1024 مع تعليقات توضيحية)، مما يوفر خيارات مرنة لتدريب النماذج بمتطلبات دقة مختلفة.

الاستخدام المباشر:https://go.hyper.ai/lTBaT

7. مجموعة بيانات التعرف على الصور الاصطناعية CIFAKE

CIFAKE هي مجموعة بيانات تركيبية لتحديد الصور المُولّدة بالذكاء الاصطناعي. وهي مجموعة بيانات صور ثنائية التصنيف، ذات قيمة تطبيقية عملية مهمة لتعزيز متانة تقنية معالجة الصور وتحسين قدرة التعرف على المحتوى المُولّد بالذكاء الاصطناعي، لا سيما في مجالات نشر الأخبار ومراقبة وسائل التواصل الاجتماعي. تحتوي مجموعة البيانات على 60,000 صورة حقيقية و60,000 صورة مُولّدة بالذكاء الاصطناعي، وهي مصممة لتقييم قدرة نماذج الرؤية الحاسوبية على تحديد الصور المُولّدة بالذكاء الاصطناعي.

الاستخدام المباشر:https://go.hyper.ai/wxeA3

مثال لمجموعة البيانات

8. مجموعة بيانات الاستدلال الطبي العام II-Medical SFT

II-Medical SFT هي مجموعة بيانات استدلال طبي عامة مصممة لدعم الضبط الدقيق المُشرف لنماذج اللغة الكبيرة (LLMs) لمهام الاستدلال الطبي. تحتوي مجموعة البيانات على ما يقارب 2.2 مليون عينة، تغطي سيناريوهات طبية متعددة المصادر، مُلبيةً احتياجات الضبط الدقيق للنماذج الطبية المُعقدة، وتهدف إلى مساعدة النماذج على تطوير قدرات رئيسية مثل التشخيص التفريقي، واتخاذ القرارات القائمة على الأدلة، والتواصل مع المرضى، وخطط العلاج القائمة على الإرشادات.

الاستخدام المباشر:https://go.hyper.ai/TGMjl

9. مجموعة بيانات اكتشاف إشارات المرور

"كشف إشارات المرور" هي مجموعة بيانات مخصصة لكشف إشارات المرور، وهي مناسبة لأبحاث التعرف على إشارات المرور في القيادة الذاتية، وأنظمة مساعدة السائق، والمدن الذكية. تحتوي مجموعة البيانات على حوالي 9000 صورة واضحة لإشارات المرور، وحوالي 4969 صورة من صور الشوارع، تغطي مشاهد مختلفة في بلدان متعددة. تتضمن الصور فئات متعددة، وهي مقسمة إلى مجموعات تدريب، ومجموعات تحقق، ومجموعات اختبار، مما يوفر تعليقات توضيحية دقيقة لمربعات التحديد.

الاستخدام المباشر:https://go.hyper.ai/VfwUw

مثال لمجموعة البيانات

10. مجموعة بيانات UniMate لمعايير المواد الميكانيكية

مجموعة بيانات UniMate هي مجموعة بيانات مرجعية للمواد الميكانيكية الفائقة، وتحتوي على 15,000 عينة. تحتوي كل عينة على بنية طوبولوجي ثلاثية الأبعاد، ومعلومات الكثافة، وخصائصها الميكانيكية المتجانسة المقابلة، وتغطي سيناريوهات من الكثافة المنخفضة (ρ=0.1) إلى الكثافة المتوسطة (ρ=0.5). يُلبي الهيكل الطوبولوجي شرطي التماثل التكعيبي والدورية.

الاستخدام المباشر:https://go.hyper.ai/1ki2l

دروس تعليمية عامة مختارة

هذا الأسبوع، قمنا بتلخيص 3 أنواع من الدروس التعليمية العامة عالية الجودة

*دليل نشر النموذج الكبير: 1

*دروس الذكاء الاصطناعي للعلوم: 2

*دروس تعليمية متعددة الوسائط: 4

برنامج تعليمي لنشر النموذج الكبير

1. يقوم Ollama+Open WebUI بنشر Kimi-Dev-72B-GGUF

Kimi-Dev-72B هو نموذج لغة برمجة مفتوح المصدر، مصمم لمهام هندسة البرمجيات. يتضمن بشكل أساسي وظائف مثل إصلاح الكود، وتوليد كود الاختبار (TestWriter)، وعملية التطوير الآلية، ودمج أدوات التطوير.

تشغيل عبر الإنترنت:https://go.hyper.ai/t6ps1

عرض التأثير

دروس الذكاء الاصطناعي للعلوم

1. استخدم الحالة للتنبؤ باستجابات اضطراب الخلايا في مواقف مختلفة

يستطيع نموذج الحالة التنبؤ باستجابة الخلايا الجذعية والخلايا السرطانية والخلايا المناعية للأدوية والسيتوكينات والتدخلات الجينية. تُظهر النتائج التجريبية أن أداء النموذج يتفوق بشكل ملحوظ على الطرق السائدة الحالية في التنبؤ بتغيرات النسخ بعد التدخل.

تشغيل عبر الإنترنت:https://go.hyper.ai/4AM6P

2. HealthGPT: مساعد طبي بالذكاء الاصطناعي

HealthGPT هو نموذج لغة بصرية طبية واسع النطاق (Med-LVLM)، يُطبّق إطارًا موحدًا لمهام الفهم البصري الطبي وتوليده من خلال تقنية تكيف المعرفة غير المتجانسة. يستخدم هذا النموذج تقنية تكيف المعرفة غير المتجانسة منخفضة الرتبة (H-LoRA) المبتكرة لتخزين معرفة مهام الفهم البصري وتوليده في مكونات إضافية مستقلة لتجنب التعارضات بين المهام.

تشغيل عبر الإنترنت:https://go.hyper.ai/KiBWB

برنامج تعليمي متعدد الوسائط

1. GLM-4.1V-التفكير: التفكير متعدد الوسائط المتنوع من خلال التعلم التعزيزي القابل للتطوير

GLM-4.1V-Thinking هو نموذج بصري لغوي (VLM) مُصمم لتعزيز الفهم والاستدلال متعدد الوسائط. من خلال الجمع بين التعلم المعزز وأخذ العينات من المناهج الدراسية (RLCS)، يُحقق هذا النموذج تحسينًا شاملًا في القدرات في مهام متنوعة، بما في ذلك حل المشكلات في مجالات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، وفهم الفيديو، والتعرف على المحتوى، والبرمجة، وحل المشكلات المرجعية، والوكلاء القائمين على واجهة المستخدم الرسومية (GUI)، وفهم المستندات الطويلة.

تشغيل عبر الإنترنت:https://go.hyper.ai/qPF8a

عرض توضيحي لميزة الدردشة النصية
عرض توضيحي لوظيفة فهم الصورة

2. EX-4D: إنشاء عرض مجاني من فيديو أحادي العين

EX-4D هو إطار عمل جديد لتوليد الفيديو رباعي الأبعاد، قادر على إنتاج مقاطع فيديو عالية الجودة من زوايا رؤية متطرفة باستخدام مدخل فيديو أحادي العين. يعتمد الإطار على تمثيل فريد لشبكة عميقة مقاومة للماء (DW-Mesh)، تُنمذج بوضوح المناطق المرئية والمحجوبة لضمان اتساق هندسي في أوضاع الكاميرا المتطرفة. يستخدم الإطار استراتيجية محاكاة قناع الانسداد لتوليد بيانات تدريب فعّالة تعتمد على الفيديو أحادي العين، ومحول انتشار فيديو خفيف الوزن قائم على LoRA لتجميع مقاطع فيديو متسقة ماديًا ومتماسكة زمنيًا. يتفوق EX-4D بشكل ملحوظ على الطرق الحالية في زوايا الرؤية المتطرفة، ويوفر حلاً جديدًا لتوليد الفيديو رباعي الأبعاد.

تشغيل عبر الإنترنت:https://go.hyper.ai/WyAPN

أمثلة المشاريع

3. MonSter: إطلاق العنان لإمكانات العمق الأحادي والرؤية المجسمة

يدمج MonSter العمق الأحادي ومطابقة الصور المجسمة في بنية ثنائية الفروع لتحسين كل منهما الآخر بشكل متكرر. يُمكّن هذا التحسين المتبادل المتكرر MonSter من التطور من هياكل بسيطة على مستوى الكائن إلى هندسة على مستوى البكسل، محققًا بذلك إمكانات مطابقة الصور المجسمة بالكامل.

تشغيل عبر الإنترنت:https://go.hyper.ai/a9Ekd

4. Holo1-7B: تحديد المواقع الدقيقة لعناصر واجهة المستخدم باستخدام اللغة الطبيعية

Holo1-7B هو نموذج لغة بصرية تفاعلية (VLM) لنظام وكيل الويب Surfer-H. صُمم للتفاعل مع واجهات الويب مثل المستخدم البشري. كجزء من بنية وكيل أوسع، يمكن لـ Holo1 أن يعمل كنموذج سياسة، أو نموذج توطين، أو نموذج تحقق، مما يساعد الوكلاء على فهم البيئات الرقمية والتحكم فيها.

تشغيل عبر الإنترنت:https://go.hyper.ai/6oQuF

مثال على التوطين
مثال على التنقل

توصيات الورقة البحثية لهذا الأسبوع

1. MemOS: نظام تشغيل ذاكرة لنظام الذكاء الاصطناعي

تقترح هذه الورقة البحثية نظام MemOS، وهو نظام تشغيل ذاكرة يُعامل الذاكرة كمورد نظام قابل للإدارة. يُوحّد هذا النظام تمثيل الذاكرة بالنص العادي، وتمثيلها القائم على التنشيط، وتمثيلها على مستوى المعلمات، وجدولتها، وتطورها، مما يُتيح تخزينًا واسترجاعًا فعالين من حيث التكلفة. يُغلّف MemCube، كوحدة أساسية، محتوى الذاكرة وبياناتها الوصفية، مثل معلومات المصدر والإصدار. يمكن دمج MemCube ونقلها ودمجها بمرور الوقت، مما يُتيح تحويلًا مرنًا بين أنواع الذاكرة المختلفة، ويربط الاسترجاع بالتعلم القائم على المعلمات. يُرسي MemOS إطار عمل نظام مُركّز على الذاكرة، يُضفي على أنظمة إدارة التعلم (LLM) قابلية التحكم والمرونة والتطور، مُرسيًا بذلك أسس التعلم المستمر والنمذجة المُخصّصة.

رابط الورقة:https://go.hyper.ai/PgtHH

2. SingLoRA: التكيف مع الرتبة المنخفضة باستخدام مصفوفة واحدة

تقترح هذه الورقة البحثية طريقة جديدة، تُسمى SingLoRA، تُعيد تعريف التكيف منخفض الرتبة من خلال التعبير عن تحديثات الأوزان كتحليل لمصفوفة واحدة منخفضة الرتبة وناقلها. يُزيل هذا التصميم البسيط بطبيعته تضارب المقياس بين المصفوفات، ويضمن استقرار عملية التحسين، ويُقلل عدد المعاملات إلى النصف تقريبًا. حلل الباحثون SingLoRA في إطار الشبكات العصبية ذات العرض اللانهائي، وأثبتوا أن تصميمها يضمن بطبيعته استقرار تعلم الميزات، وأثبتوا هذه المزايا من خلال تجارب مكثفة.

رابط الورقة:https://go.hyper.ai/kUu4u

3. هل يجب علينا الاستمرار في تدريب المشفرات باستخدام نمذجة اللغة المقنعة؟

أظهرت الأبحاث أن نماذج فك التشفير المُدرَّبة مسبقًا باستخدام نماذج اللغة السببية (CLMs) يُمكن إعادة استخدامها بفعالية في مهام التشفير، إلا أن سبب تحسين الأداء غير واضح. يستكشف هذا البحث هذا السؤال من خلال سلسلة من تجارب الاستئصال قبل التدريب واسعة النطاق والمُتحكَّم فيها بعناية، مُبرهنًا تجريبيًا أن استراتيجية تدريب من مرحلتين - تطبيق CLM أولًا ثم MLM - يُمكن أن تُحقِّق أفضل أداء بميزانية موارد حسابية ثابتة، وأن هذه الاستراتيجية أكثر جاذبية عند تهيئة نماذج CLM مُدرَّبة مسبقًا من نظام نماذج اللغة الكبيرة الحالي.

رابط الورقة:https://go.hyper.ai/eN7kf

4. دراسة استقصائية حول التفكير الكامن

لتعزيز أبحاث الاستدلال الكامن، تُقدّم هذه الورقة البحثية نظرةً شاملةً على هذا المجال الناشئ. من خلال استكشاف الدور الأساسي لطبقات الشبكات العصبية كمصفوفة حسابية للاستدلال، ودراسة مختلف أساليب الاستدلال الكامن، ومناقشة النماذج المتقدمة (مثل الاستدلال الكامن بعمق غير محدود، والذي تُحققه نماذج الانتشار المُقنّعة)، تهدف الورقة إلى توضيح الإطار المفاهيمي للاستدلال الكامن، وتحديد التوجهات المستقبلية للأبحاث في مجال إدراك ماجستير القانون.

رابط الورقة:https://go.hyper.ai/kIuD8

5. قاعدة معلومات العميل: الاستفادة من الخبرة عبر المجالات لحل المشكلات الوكيلية

تُقدّم هذه الورقة البحثية قاعدة بيانات العميل (Agent KB)، وهي إطار عمل هرمي للتجربة يُمكّن العميل من حل مشاكله المعقدة من خلال خط أنابيب مُبتكر يُسمى "السبب-الاسترجاع-التحسين". تُظهر نتائجنا أن قاعدة بيانات العميل تُوفّر بنية تحتية معيارية لا تعتمد على إطار عمل، تُمكّن العملاء من التعلم من التجارب السابقة وتعميم الاستراتيجيات الناجحة على المهام الجديدة.

رابط الورقة:https://go.hyper.ai/2wJPd

مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:https://go.hyper.ai/iSYSZ

تفسير مقالة المجتمع

تحققت نبوءة تشيان شيويه سين "العالم الروحي"! طوّرت جامعة شنغهاي جياوتونغ، وجامعة شنغهاي الرياضية، وجامعة تسينغهوا، وغيرها، أول نظام تدخل رياضي واقع افتراضي في العالم، REVERIE، لإعادة تشكيل صحة الدماغ والجسم والعقل لدى المراهقين.

ابتكر فريق بحثي من جامعة شنغهاي جياو تونغ، بالتعاون مع جامعة شنغهاي للرياضة وجامعة تسينغهوا، أول نظام تدخل رياضي ذكي بتقنية الواقع الافتراضي في العالم، "Spirit Realm"، للتحكم في وزن المراهقين الذين يعانون من زيادة الوزن أو السمنة. يستخدم النظام مدربًا افتراضيًا ثنائيًا، مدفوعًا بالتعلم التعزيزي العميق، ويعتمد على بنية Transformer، لتوفير توجيه رياضي آمن وغامر. ولا يختلف أداؤه البيوميكانيكي واستجابته لمعدل ضربات القلب أثناء التمرين بشكل كبير عن نفس النوع من الرياضات في العالم الحقيقي.

شاهد التقرير الكامل:https://go.hyper.ai/Q3KKv

٢. هل أنت متخصص في مراجعة الذكاء الاصطناعي؟ تحتوي الأوراق البحثية على تقييمات إيجابية خفية، يدعو شيه ساينينغ إلى الاهتمام بتطور أخلاقيات البحث العلمي في عصر الذكاء الاصطناعي.

مؤخرًا، كُشف النقاب عن احتواء أوراق بحثية من 14 جامعة حول العالم على تعليمات خفية مُدمجة فيها، تُرشد مُراجعي الذكاء الاصطناعي إلى تقديم تقييمات إيجابية. أثار هذا التقرير نقاشات حادة في الأوساط الأكاديمية، ولفت انتباه الناس إلى المخاطر والتحديات الأخلاقية المُترتبة على استخدام مُراجعي الذكاء الاصطناعي. كما اتُهمت ورقة فريق شيه ساينينغ البحثية بإخفاء التعليقات الإيجابية، فنشر مقالًا مُطولًا ردًا على ذلك، داعيًا إلى الاهتمام بتطور أخلاقيات البحث العلمي في عصر الذكاء الاصطناعي.

شاهد التقرير الكامل:https://go.hyper.ai/LZ0TJ

3. نفذت الجامعة الوطنية في سنغافورة نمذجة دقيقة لمجموعة المرضى استنادًا إلى بيانات السجلات الصحية الإلكترونية متعددة الأبعاد، وزادت دقة التنبؤ بمدة الإقامة في المستشفى بمقدار 16.3%

اقترحت جامعة سنغافورة الوطنية وجامعة تشجيانغ بشكل مشترك طريقةً مبتكرةً تُعرف باسم NeuralCohort، والتي فتحت آفاقًا جديدةً لتعلم تمثيل السجلات الصحية الإلكترونية، وأطلقت العنان لإمكانات بيانات السجلات الصحية الإلكترونية. وقد استفادت هذه الطريقة في الوقت نفسه من المعلومات المحلية داخل المجموعة السريرية والمعلومات العالمية بين المجموعات السريرية، وهي عناصر أساسية لم تُتناول بالكامل في دراسات تحليل السجلات الصحية الإلكترونية السابقة.

شاهد التقرير الكامل:https://go.hyper.ai/1b8lG

4. مهندس الذكاء الاصطناعي في AMD، تشانغ نينغ: تحليل مُجمِّع AMD Triton من وجهات نظر متعددة للمساعدة في بناء نظام بيئي مفتوح المصدر

اختُتم بنجاح مؤتمر "لقاء 2025" السابع لتكنولوجيا مُجمّعات الذكاء الاصطناعي في تشونغ قوان تسون ببكين في 5 يوليو. ألقى تشانغ نينغ، مهندس الذكاء الاصطناعي من AMD، كلمة بعنوان "مساعدة مجتمع المصادر المفتوحة: تحليل مُجمّع AMD Triton". ركّز على المساهمات التقنية للشركة في مجتمع المصادر المفتوحة، وفسّر بشكل منهجي التكنولوجيا الأساسية، ودعم البنية التحتية، وإنجازات البناء البيئي لمُجمّع AMD Triton، مما وفّر للمطورين منظورًا شاملًا لفهم متعمق لبرمجة وحدات معالجة الرسومات عالية الأداء وتحسين المُجمّع. هذه المقالة هي نسخة من أبرز ما قدّمه تشانغ نينغ.

شاهد التقرير الكامل:https://go.hyper.ai/jJLD8

5. البرنامج التعليمي عبر الإنترنت: قم بتحرير صورة بدقة في جملة واحدة، يمكن لبرنامج FLUX.1 Kontext تحقيق تحرير الصور/نقل الأسلوب/تحرير النص/تحرير تناسق الأحرف

في عصرٍ تهيمن عليه وسائل التواصل الاجتماعي والمحتوى المرئي، تطور "تحرير الصور" من مهارة تصميم إلى حاجة يومية عامة. لم يتوقف إقبال المستخدمين على أدوات سهلة الاستخدام وفعالة، وأصبح "تحرير الصور بجملة واحدة" حقيقةً واقعةً تدريجيًا مع التقدم التكنولوجي الهائل. حقق نموذج FLUX.1-Kontext-dev، المفتوح المصدر مؤخرًا، أداءً عاليًا يُضاهي عددًا من النماذج مغلقة المصدر مثل GPT-image-1، مع 12 مليار معلمة فقط.

شاهد التقرير الكامل:https://go.hyper.ai/EJIIa

مقالات موسوعية شعبية

1. دال-إي

2. دمج الفرز المتبادل RRF

3. جبهة باريتو

4. فهم اللغة متعدد المهام على نطاق واسع (MMLU)

5. التعلم التبايني

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

تتبع شامل لأفضل المؤتمرات الأكاديمية في مجال الذكاء الاصطناعي:https://go.hyper.ai/event


إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!