يتم تشغيل EasyControl، وهي أداة لإنشاء لوحات فنية على طراز Ghibli، بنقرة واحدة؛ يمكن تحويل صورة واحدة إلى نموذج ثلاثي الأبعاد في ثوانٍ، حيث تعمل TripoSG على إحداث ثورة في توليد الأصول ثلاثية الأبعاد

انتشرت صور على طراز جيبلي على وسائل التواصل الاجتماعي في الآونة الأخيرة. عندما يضيف الناس مرشحات الرسوم المتحركة الخاصة بهاياو ميازاكي إلى الأفلام أو المسلسلات التلفزيونية، فإن الأمر يبدو كما لو أنهم نقلوا إلى عالم خيالي مليء بالخيال. ومع ذلك، بالنسبة للعديد من المستخدمين الذين يريدون إنشاء صور على طراز Ghibli بأنفسهم، فإن نماذج التوليد الحالية غالبًا ما تواجه مشكلات مثل التشغيل المعقد أو عتبة الاستخدام العالية أو تأثيرات التوليد غير المرضية.
يقلل برنامج EasyControl بشكل كبير من عتبة الإبداع بفضل تقنيته المتقدمة وواجهته البسيطة وسهلة الاستخدام.يقدم حقنًا مشروطًا خفيف الوزن وحدة LoRA، نموذج التدريب القائم على الموقع، وآلية الاهتمام السببيو تقنية ذاكرة التخزين المؤقت KV، مما يحسن بشكل كبير من توافق النموذج، ويدعم وظيفة التوصيل والتشغيل والتحكم في الأسلوب غير المدمر.
في الوقت الحالي،هايبر ايه ايتم إطلاق البرنامج التعليمي "عرض توضيحي لإنشاء الصور على غرار Ghibli من EasyControl".يستخدم العرض التوضيحي نموذج التحكم Img2Img المصمم لتحويل صورة شخصية إلىأسلوب ميازاكيالأعمال الفنية، تعال وجربها~
الاستخدام عبر الإنترنت:https://go.hyper.ai/jWm9j
من 21 أبريل إلى 25 أبريل، تحديثات الموقع الرسمي لـ hyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* دروس تعليمية عالية الجودة: 12
* اختيار المقالات المجتمعية: 4 مقالات
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات مع الموعد النهائي في أبريل: 1
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات صور جوية لحركة المرور في إسبانيا
تحتوي مجموعة البيانات على 15070 إطارًا من الصور التي التقطتها المركبات الجوية غير المأهولة (UAVs) وتغطي مجموعة متنوعة من سيناريوهات المرور، بما في ذلك الطرق الإقليمية، والتقاطعات الحضرية، والطرق الريفية، وأنواع مختلفة من الدوارات. يوجد 155,328 جسمًا موضحًا في الصور، منها 137,602 سيارة و17,726 دراجة نارية. هذه الصور هي تنسيق YOLOيعد التخزين مناسبًا لتدريب خوارزميات الرؤية الآلية المستندة إلى الشبكات العصبية التلافيفية.
الاستخدام المباشر:https://go.hyper.ai/VJoXE

2. مجموعة بيانات صور الموجات فوق الصوتية للقلب CAMUS
تحتوي مجموعة البيانات على تسلسلات عرض قمية ثنائية الأبعاد مكونة من أربع حجرات وحجرتين من 500 مريض، تم جمعها في مستشفى جامعة سانت إتيان في فرنسا، وتم إخفاء هوية أصحابها بالكامل لضمان خصوصية المريض والامتثال للبيانات. تم شرح كل صورة بدقة من قبل طاقم طبي محترف، وتغطي معلومات محيط بطانة القلب اليسرى، وتجويف القلب الأيسر، والأذين الأيسر. توفر هذه التعليقات التفصيلية للباحثين موارد غنية للتدريب والتحقق.
الاستخدام المباشر:https://go.hyper.ai/iYtn2

3. السفن/السفن في الصور الجوية
تحتوي مجموعة البيانات هذه على 26.9 ألف صورة بفئة الصورة "سفينة" فقط. تمت ملاحظة هذه الصور بعناية خصيصًا لاكتشاف السفن. يتم تقديم تعليقات المربع المحدد بتنسيق YOLO، والذي يمكنه اكتشاف السفن في الصور بدقة وكفاءة.
الاستخدام المباشر:https://go.hyper.ai/s03Tk

4. مجموعة بيانات التصوير الجوي للمناظر الطبيعية للمدينة من SkyCity
هذه المجموعة من البيانات هي مجموعة بيانات مختارة لتصنيف المناظر الطبيعية الجوية، بإجمالي 8 آلاف صورة، بما في ذلك 10 فئات مختلفة، تحتوي كل فئة على 800 صورة عالية الجودة بدقة 256 × 256 بكسل. تجمع مجموعة البيانات هذه المناظر الطبيعية الحضرية من مجموعات البيانات المتاحة للجمهور AID وNWPU-Resisc45، بهدف تسهيل تحليل المناظر الطبيعية الحضرية.
الاستخدام المباشر:https://go.hyper.ai/eCRdN

5. 302 مجموعة بيانات لحالات الأمراض النادرة
تحتوي مجموعة البيانات على 302 مرضًا نادرًا، حيث يتم اختيار 1 إلى 9 أمراض نادرة عشوائيًا من كل فئة. تم اختيار هذه الأمراض النادرة من بين أكثر من 7 آلاف مرض نادر من 33 نوعًا في قاعدة بيانات Orphanet، وهي قاعدة بيانات شاملة للأمراض النادرة تم تمويلها بالاشتراك مع المفوضية الأوروبية.
الاستخدام المباشر:https://go.hyper.ai/LwqME
6. مجموعة بيانات اختبار بنية الحمض النووي الريبوزي DRfold2
تُعد مجموعة البيانات هذه مجموعة بيانات اختبار مستقلة تم إنشاؤها لتقييم أداء DRfold2 بشكل موضوعي في هذه الدراسة. يحتوي على 28 بنية RNA بطول تسلسل أقل من 400 nts ويأتي من الفئات الثلاث التالية: أحدث تسلسلات أهداف RNA-Puzzles؛ تسلسلات هدف الحمض النووي الريبي في المنافسة CASP15؛ وأحدث هياكل الحمض النووي الريبي المنشورة في قاعدة بيانات بنك بيانات البروتين (PDB) اعتبارًا من 1 أغسطس 2024.
الاستخدام المباشر:https://go.hyper.ai/shkp6
7. مجموعة بيانات الصور الطبية للقلب بمؤسسة حمد الطبية-جامعة قطر
تحتوي مجموعة البيانات على تسجيلات تخطيط صدى القلب ثنائية الأبعاد (الصدى) للمشاهد القمية المكونة من أربع حجرات (A4C) والقمية المكونة من حجرتين (A2C) التي تم الحصول عليها خلال عامي 2018 و2019. تم الحصول على التسجيلات بواسطة معدات من شركات تصنيع مختلفة (على سبيل المثال، أجهزة الموجات فوق الصوتية Phillips وGE Vivid) بدقة زمنية تبلغ 25 إطارًا في الثانية ودقة مكانية تتراوح من 422 × 636 إلى 768 × 1024 بكسل.
الاستخدام المباشر:https://go.hyper.ai/gQN8a
8. مجموعة بيانات الاستدلال - الإصدار 1 - 20 دقيقة
يحتوي Reasoning-v1-20m على حوالي 20 مليون أثر استدلالي، يغطي مشاكل معقدة في مجالات متعددة مثل الرياضيات والبرمجة والعلوم. تهدف مجموعة البيانات هذه إلى مساعدة النموذج على تعلم منطق التفكير المعقد وتحسين أدائه في مهام التفكير متعددة الخطوات من خلال توفير أمثلة غنية لعملية التفكير.
الاستخدام المباشر:https://go.hyper.ai/c2RqP
9. مجموعة بيانات الإجابة على الأسئلة متعددة المهام II-Thought-RL-v0
II-Thought-RL-v0 عبارة عن مجموعة بيانات واسعة النطاق ومتعددة المهام مصممة للتعلم المعزز والإجابة على المشكلات. يحتوي على أزواج عالية الجودة من الأسئلة والأجوبة تم تصفيتها بدقة في خطوات متعددة، وتغطي مجالات متعددة مثل الرياضيات والبرمجة والعلوم. لا تأتي أزواج الأسئلة في مجموعة البيانات من مجموعات البيانات العامة فحسب، بل تحتوي أيضًا على أزواج أسئلة مخصصة عالية الجودة لضمان تنوع البيانات وعمليتها.
الاستخدام المباشر:https://go.hyper.ai/9eSSq
١٠. مجموعة بيانات مهمة الاستدلال العام واسعة النطاق AM-DeepSeek-R1-Distilled-1.4M
تحتوي مجموعة البيانات على ما يقرب من 1.4 مليون إدخال بيانات، تغطي مجموعة متنوعة من أنواع الأسئلة بما في ذلك الرياضيات والترميز والأسئلة والأجوبة العلمية والدردشة العامة. لقد تم اختيار هذه البيانات بعناية، وتم إزالة التكرارات الدلالية منها وتنظيفها بدقة لضمان الجودة العالية والتحدي الذي تتمتع به البيانات. يحتوي كل إدخال في مجموعة البيانات على مسارات تفكير غنية، والتي لا تزود النموذج بأمثلة لعملية التفكير فحسب، بل تساعد النموذج أيضًا على فهم مهام التفكير المعقدة وتوليد حلول لها بشكل أفضل.
الاستخدام المباشر:https://go.hyper.ai/2PSxR
دروس تعليمية عامة مختارة
1. YOLOE: شاهد كل شيء في الوقت الفعلي
YOLOE هو نموذج مرئي جديد في الوقت الحقيقي اقترحه فريق بحثي من جامعة تسينغهوا في عام 2025، ويهدف إلى تحقيق هدف "رؤية كل شيء في الوقت الحقيقي". إنه يرث خصائص الوقت الحقيقي والفعالة لسلسلة نماذج YOLO، وعلى هذا الأساس يدمج بشكل عميق قدرات التعلم من الصفر والتوجيه المتعدد الوسائط، ويمكنه دعم اكتشاف الهدف وتقسيمه في سيناريوهات متعددة مثل النص والرؤية والتوجيه الصامت.
لقد تم نشر النماذج والتبعيات ذات الصلة بهذا المشروع. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب.
تشغيل عبر الإنترنت:https://go.hyper.ai/rOIS1

2. نشر R1-OneVision بنقرة واحدة
R1-OneVision هو نموذج تفكير متعدد الوسائط كبير الحجم أصدره فريق من جامعة تشجيانغ. تم ضبط النموذج بناءً على Qwen2.5-VL على مجموعة البيانات R1-Onevision. فهو جيد في التعامل مع مهام التفكير البصري المعقدة ودمج البيانات البصرية والنصية بسلاسة. ويؤدي أداءه بشكل جيد في مجالات مثل الرياضيات والعلوم وفهم الصور العميقة والتفكير المنطقي، ويمكن أن يعمل كمساعد ذكاء اصطناعي قوي لحل العديد من المشكلات.
يستخدم هذا البرنامج التعليمي R1-Onevision-7B كعرض توضيحي، ويستخدم مورد الحوسبة RTX 4090. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب.
تشغيل عبر الإنترنت:https://go.hyper.ai/7I2pi

3. UNO: إنشاء صور مخصصة عالمية
يمكن لمشروع UNO دعم إنشاء صور لموضوع واحد ومتعدد الموضوعات، وتوحيد مهام متعددة باستخدام نموذج واحد وإظهار قدرات تعميم قوية.
يعتمد هذا المشروع على FLUX.1-dev-fp 8 ويمكنه التعرف بسرعة على النص وإنشاء صور استنادًا إلى أوصاف النص.
تشغيل عبر الإنترنت:https://go.hyper.ai/r8JZo

4. TripoSG: تحويل صورة واحدة إلى صورة ثلاثية الأبعاد عالية الدقة في ثوانٍ
TripoSG هو نموذج أساسي متقدم لتوليد الصور ثلاثية الأبعاد يتمتع بدقة عالية وجودة عالية وشمولية عالية. إنه يستفيد من المحولات المعدلة واسعة النطاق والتدريب الخاضع للإشراف الهجين ومجموعات البيانات عالية الجودة لتحقيق أداء متطور في توليد الأشكال ثلاثية الأبعاد.
لقد تم نشر النماذج والتبعيات ذات الصلة بهذا المشروع. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب.
تشغيل عبر الإنترنت:https://go.hyper.ai/rcWwu

5. عرض توضيحي لإنشاء صور عالية الدقة باستخدام InfiniteYou
InfiniteYou، المختصر باسم InfU، هو إطار عمل لتوليد الصور مع الحفاظ على الهوية ويعتمد على محولات الانتشار (مثل FLUX) التي أطلقها فريق الإنشاء الذكي في ByteDance في عام 2025. ومن خلال التكنولوجيا المتقدمة، فإنه قادر على الحفاظ على اتساق هوية الشخص أثناء توليد الصور، وحل أوجه القصور في الطرق الحالية في تشابه الهوية ومحاذاة النص والصورة وجودة التوليد.
يستخدم هذا البرنامج التعليمي InfiniteYou-FLUX v1.0 كعرض توضيحي، ومورد قوة الحوسبة هو A6000. انقر على الرابط أدناه لاستنساخ النموذج بسرعة.
تشغيل عبر الإنترنت:https://go.hyper.ai/K5Yl5

6. نشر DeepCoder-14B-Preview بنقرة واحدة
مشروع DeepCoder-14B-Preview هو نموذج ترميز 14B تم إصداره بواسطة AGENTICA في 8 أبريل 2025. تم ضبط النموذج بدقة من DeepSeek-R1-Distilled-Qwen-14B LLM من أجل استدلال الكود، ويتناسب مع أطوال السياق الطويلة باستخدام التعلم التعزيزي التوزيعي (RL). يحقق النموذج دقة Pass@1 تبلغ 60.6% على LiveCodeBench v5 (8/1/24-2/1/25)، وهو تحسن قدره 8% مقارنة بالنموذج الأساسي (53%)، ويحقق أداءً مشابهًا لـ o3-mini من OpenAI مع 14B معلمة فقط.
يستخدم هذا البرنامج التعليمي نموذج DeepCoder-14B-Preview كحالة توضيحية ويتبنى طريقة التكميم المكونة من 8 بتات التي توفرها bitsandbytes لتحسين استخدام ذاكرة الفيديو.
تشغيل عبر الإنترنت:https://go.hyper.ai/17aD2

7. عرض توضيحي لإنشاء صور على طراز Ghibli باستخدام EasyControl
EasyControl هو مشروع يهدف إلى إضافة تحكم فعال ومرن إلى محول الانتشار. يعمل المشروع على تحسين توافق النموذج بشكل كبير من خلال تقديم وحدات LoRA خفيفة الوزن ذات الحقن المشروط، وأنماط التدريب القائمة على الموقع، والجمع بين آليات الاهتمام السببي وتكنولوجيا ذاكرة التخزين المؤقت KV، ودعم وظيفة التوصيل والتشغيل والتحكم في الأسلوب بدون فقدان.
يستخدم هذا البرنامج التعليمي نموذج Stylized Img2Img Controls، الذي يمكنه تحويل صورة شخصية إلى عمل فني على طراز Hayao Miyazaki، مع الحفاظ على ملامح الوجه وتطبيق جماليات الأنمي الشهيرة.
تشغيل عبر الإنترنت:https://go.hyper.ai/jWm9j

8. Qwen2.5-0mni: دعم كامل للقراءة والاستماع والكتابة
Qwen2.5-Omni هو أحدث طراز رائد متعدد الوسائط من البداية إلى النهاية تم إصداره بواسطة فريق Tongyi Qianwen التابع لشركة Alibaba. تم تصميمه لتوفير إدراك متعدد الوسائط شامل ومعالجة المدخلات المختلفة بسلاسة بما في ذلك النصوص والصور والصوت والفيديو، مع دعم إنشاء النص المتدفق وإخراج توليف الكلام الطبيعي.
يستخدم هذا البرنامج التعليمي Qwen2.5-Omni كعرض توضيحي، وموارد الحوسبة هي A6000.
تشغيل عبر الإنترنت:https://go.hyper.ai/eghWg

9. نشر Qwen2.5-VL-32B-Instruct بنقرة واحدة
Qwen2.5-VL-32B-Instruct هو نموذج كبير متعدد الوسائط مفتوح المصدر تم تطويره بواسطة فريق Alibaba Tongyi Qianwen. استنادًا إلى سلسلة Qwen2.5-VL، تم تحسين هذا النموذج من خلال تقنية التعلم التعزيزي ويحقق تقدمًا كبيرًا في القدرات المتعددة الوسائط بمقياس معلمات 32B.
يستخدم هذا البرنامج التعليمي Qwen2.5-VL-32B كعرض توضيحي، وموارد الحوسبة هي A6000*2. تتضمن الوظائف فهم النص، وفهم الصورة، وفهم الفيديو.
تشغيل عبر الإنترنت:https://go.hyper.ai/Dp2Pd

10. نشر بنقرة واحدة Qwen2.5-VL-32B-Instruct-AWQ
Qwen2.5-VL-32B-Instruct-AWQ هو إصدار كمي من Qwen2.5-VL-32B-Instruct، والذي يعمل على تحسين قدرات البرمجة والحوسبة الرياضية بشكل كبير. يدعم النموذج التفاعلات بـ 29 لغة، ويمكنه معالجة النصوص الطويلة المكونة من 128 ألف رمز، ولديه وظائف أساسية مثل فهم البيانات المنظمة وتوليد JSON. تم تطويره على أساس بنية المحولات، ويحقق نشرًا فعالًا من خلال تقنية التكميم وهو مناسب لسيناريوهات تطبيق الذكاء الاصطناعي على نطاق واسع.
لقد تم نشر النماذج والتبعيات ذات الصلة بهذا المشروع. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب.
تشغيل عبر الإنترنت:https://go.hyper.ai/fAYEK
منذ إصداره، حصل DeepCoder-14B-Preview على أكثر من 3 آلاف نجمة على GitHub لأدائه المتميز في مهام فهم الكود والاستدلال. لقد أظهر النموذج قدرات مماثلة لـ o3-mini في تقييمات متعددة، كما يتمتع بأداء تفكير فعال وقابلية جيدة للتوسع.
لمساعدة المطورين على تجربة النموذج ونشره بسرعة، أطلق قسم البرامج التعليمية في الموقع الرسمي لـ HyperAl البرنامج التعليمي "نشر DeepCoder-14B-Preview بنقرة واحدة". انقر على الرابط أدناه للبدء بسرعة.
تشغيل عبر الإنترنت:https://go.hyper.ai/V42RT
لتعزيز تطبيق وتطوير هندسة البروتين بالذكاء الاصطناعي، قامت مجموعة البحث التابعة للأستاذ هونغ ليانغ من جامعة شنغهاي جياو تونغ بتطوير منصة مفتوحة شاملة، VenusFactory، مصممة خصيصًا لهندسة البروتين. يستطيع الباحثون بسهولة استدعاء أكثر من 40 نموذجًا متطورًا للتعلم العميق للبروتين دون الحاجة إلى كتابة أكواد معقدة.
حاليًا، أطلق الموقع الرسمي لشركة HyperAI برنامجًا تعليميًا للنشر بنقرة واحدة لـ "منصة تصميم هندسة البروتين VenusFactory". انقر فوق "استنساخ" لبدء تشغيله بنقرة واحدة.
تشغيل عبر الإنترنت:https://go.hyper.ai/TnskV
مقالات المجتمع
اقترح مختبر الذكاء الاصطناعي في شنغهاي والعديد من الجامعات نموذج مامي، قدم بشكل مبتكر محول معلمات نموذجي مستمر، مما كسر قيود النموذج الفردي التقليدي وسمح للنموذج الموحد بالتكيف مع نماذج الإدخال المتعددة مثل الأشعة السينية والتصوير المقطعي المحوسب في الوقت الفعلي. تم تقييم MaMI على 11 مجموعة بيانات تصوير طبي عام، وقد أظهر أداءً متطورًا لإعادة التعريف، مما يوفر دعمًا قويًا لاسترجاع الصور التاريخية الدقيقة والديناميكية في الطب الشخصي. هذه المقالة عبارة عن تفسير مفصل ومشاركة للبحث.
شاهد التقرير الكامل:https://go.hyper.ai/e8Eat
تلتزم شركة Phaseshift Technologies، وهي شركة كندية متخصصة في المواد المتقدمة، باستخدام تقنية الذكاء الاصطناعي والمحاكاة متعددة المقاييس لتطوير الجيل التالي من السبائك والمركبات. يمكن لمنصتها Rapid Alloy Design (RAD™) تطوير سبائك مخصصة لاحتياجات وسيناريوهات محددة في مختلف الصناعات، مما يزيد من سرعة تطوير المواد إلى 100 مرة من الطرق التقليدية مع خفض التكاليف بنسبة 90%. تعتبر هذه المقالة تقريرا مفصلا عن الشركة.
شاهد التقرير الكامل:https://go.hyper.ai/da4VH
قدم البروفيسور لوه شياوتشو من معهد شنتشن للتكنولوجيا المتقدمة التابع للأكاديمية الصينية للعلوم عرضًا متعمقًا حول موضوع "هندسة الإنزيمات المدفوعة بالذكاء الاصطناعي" في قمة تصميم البروتين بالذكاء الاصطناعي "المستقبل قادم" التي استضافتها جامعة شنغهاي جياو تونغ. من وجهات نظر متعددة مثل إطار عمل UniKP وآلة ProEnsemble، يتم شرح التطبيقات المبتكرة للذكاء الاصطناعي في هندسة الإنزيمات وممارسات التصنيع الحيوي الخاصة بها. هذه المقالة هي نص مكتوب من مشاركة البروفيسور لوه شياوزو.
شاهد التقرير الكامل:https://go.hyper.ai/de1KW
اقترحت فرق من جامعات مرموقة مثل معهد ماساتشوستس للتكنولوجيا وجامعة كاليفورنيا في بيركلي وجامعة هارفارد وجامعة ستانفورد بشكل مشترك خوارزمية DRAKES المبتكرة. ومن خلال تقديم إطار عمل التعلم التعزيزي، أدركوا لأول مرة الانتشار الخلفي للمكافأة القابل للتفاضل للمسار الناتج بالكامل في نموذج الانتشار المنفصل، مما أدى إلى تحسين أداء المهام اللاحقة بشكل كبير مع الحفاظ على طبيعية التسلسل. هذه المقالة عبارة عن تفسير مفصل ومشاركة لورقة البحث.
شاهد التقرير الكامل:https://go.hyper.ai/YyEof
مقالات موسوعية شعبية
1. دال-إي
2. دمج الفرز المتبادل RRF
3. جبهة باريتو
4. فهم اللغة متعدد المهام على نطاق واسع (MMLU)
5. التعلم التبايني
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا: