HyperAI

اختيارات المحرر الأسبوعية | تشغيل نموذج Deepmoney المالي عبر الإنترنت، وتفضيلات الذكاء الاصطناعي ومجموعات البيانات عالية الجودة الأخرى عبر الإنترنت

特色图像

في الوقت الحاضر، يتم تدريب معظم نتائج الأبحاث حول النماذج المالية في مجال الذكاء الاصطناعي على أساس المعرفة العامة. ومع ذلك، في الممارسة المالية الفعلية، فإن القدرة على تفسير هذه المعرفة العامة للسوق الحالية غالبا ما تكون غير كافية على نحو خطير. يجب أن يكون النموذج المالي الكبير المثالي قادرًا على فهم الأخبار أو أحداث البيانات وتقييمها على الفور من المنظورين الذاتي والكمي.
تم إنشاء Deepmoney لهذا الغرض. وهو مشروع نموذجي لغوي واسع النطاق يركز على الاستثمار في المجال المالي. يوفر الموقع الرسمي لـ hyper.ai الآن دروسًا تعليمية للتشغيل عبر الإنترنت، تعال وجربها!

من 18 مارس إلى 22 مارس، تحديثات الموقع الرسمي لـhyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3

* اختيار المقالات المجتمعية: 3 مقالات

* إدخالات الموسوعة الشعبية: 10

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. OpenHermesPreferences: مجموعة بيانات تفضيلات الذكاء الاصطناعي تم إنشاء مجموعة بيانات OpenHermesPreferences بواسطة Argilla بالتعاون مع فريق Hugging Face H4 وتحتوي على ما يقرب من مليون بيانات تفضيلات الذكاء الاصطناعي. يمكن استخدام مجموعة البيانات هذه لتدريب نماذج التفضيلات أو لمواءمة نماذج اللغة عبر تقنيات مثل تحسين التفضيلات المباشرة.

الاستخدام المباشر:

https://my5353.com/30168

2. مجموعة بيانات محاذاة السياق الطويل LongAlign 10K ذات النموذج الكبير

LongAlign-10k هي مجموعة بيانات اقترحتها جامعة تسينغهوا لمعالجة التحديات التي تواجهها النماذج الكبيرة في مهام المحاذاة ذات السياق الطويل. يحتوي على 10000 من بيانات التعليمات الطويلة بطول يتراوح بين 8 كيلو بايت و64 كيلو بايت. تم تصميم مجموعة البيانات لتقييم أداء النماذج الكبيرة في السياقات الطويلة وقدرتها على اتباع تعليمات المهام التي يبلغ طولها من 10 آلاف إلى 100 ألف.

الاستخدام المباشر:

https://my5353.com/30247

3. مجموعة بيانات تقييم الأمن السيبراني للنموذج الكبير CyberMetric

تحتوي مجموعة بيانات CyberMetric على 10000 سؤال مصممة لتقييم المعرفة المتعلقة بالأمن السيبراني للنماذج الكبيرة بشكل شامل. تم إنشاء مجموعة البيانات باستخدام نماذج كبيرة مختلفة وتم التحقق من صحتها من قبل خبراء في مجال الأمن السيبراني لضمان أهميتها ودقتها.

الاستخدام المباشر:

https://my5353.com/30251

4. مجموعة بيانات خريطة محطة الطاقة الكهروضوئية الأرضية في الصين لعام 2020 بمقياس وطني 10 أمتار

قامت جامعة الزراعة الصينية، بالتعاون مع معهد العلوم الجغرافية وبحوث الموارد الطبيعية التابع للأكاديمية الصينية للعلوم، بتطوير طريقة رسم الخرائط الوطنية لمعالجة نقص البيانات عالية الدقة والمفتوحة المصدر حول توزيع محطات الطاقة الكهروضوئية الأرضية الوطنية في الصين. لقد أصدروا بنجاح مجموعة بيانات تصنيف محطات الطاقة الكهروضوئية الأرضية الوطنية بدقة 10 أمتار لعام 2020. ولا يكشف هذا الإنجاز بدقة عن خصائص التوزيع المكاني لمحطات الطاقة الكهروضوئية في بلدي فحسب، بل يوفر أيضًا موارد بيانات قيمة لتخطيط الطاقة واستخدام الأراضي ومراقبة الاستشعار عن بعد والبحث البيئي بدقة تصنيف تبلغ 89%. وتساهم هذه الخطوة في سد فجوة البيانات في هذا المجال في الصين، وهي ذات أهمية كبيرة للبحوث ذات الصلة.

الاستخدام المباشر:

https://my5353.com/30283

5. تصنيف أمراض المحاصيل مجموعة بيانات صور تصنيف أمراض المحاصيل

تحتوي مجموعة البيانات على صور مصنفة لخمسة أمراض محاصيل، والتي تم تصنيفها على النحو التالي: ذبول الكسافا البكتيري (CBB)، ومرض خطوط الكسافا البنية (CBSD)، ومرض البقعة الخضراء في الكسافا (CGM)، ومرض فسيفساء الكسافا (CMD) والصحة. يمكن استخدامه لتدريب نماذج التعلم الآلي للكشف عن أمراض النبات، أو لتطوير خوارزميات لتشخيص النبات تلقائيًا.

الاستخدام المباشر:

https://my5353.com/30293

6. الكشف عن أمراض أوراق الطماطم - مجموعة بيانات الكشف عن صور أمراض أوراق الطماطم

هذه المجموعة من البيانات عبارة عن مجموعة بيانات لكشف صور أمراض أوراق الطماطم. يتم تقسيم الصور إلى الفئات التالية: صحية، بقعة بكتيرية، اللفحة المبكرة، صحية، اللفحة المتأخرة، عفن الأوراق، نقطة الهدف، والبقعة السوداء. تم التعليق على الصور باستخدام تنسيق YOLO v5 PyTorch.

الاستخدام المباشر:

https://my5353.com/30306

7. مجموعة بيانات مراجعات أمازون الكبيرة لعام 2023

AMAZON REVIEWS 2023 عبارة عن مجموعة بيانات واسعة النطاق لمراجعات أمازون تم جمعها بواسطة McAuley Lab في عام 2023، وتحتوي على أكثر من 570 مليون مراجعة و48 مليون منتج، تغطي 33 فئة مختلفة.

الاستخدام المباشر:

https://my5353.com/30267

8. مجموعة بيانات تزوير الوجوه المُولّدة بواسطة نموذج انتشار DiFF

DiFF هي مجموعة بيانات عالية الجودة وواسعة النطاق لصور تزوير الوجوه تم تطويرها بشكل مشترك من قبل جامعة شاندونغ والجامعة الوطنية في سنغافورة ومؤسسات أخرى. يتم إنشاؤه بناءً على نموذج الانتشار ويحتوي على أكثر من 500000 صورة. تعتبر مجموعة البيانات هذه مناسبة لاكتشاف تزوير الوجه والهجمات المعادية والدفاعات ضد التزييف العميق وغيرها من مهام تدريب الرؤية الحاسوبية ذات الصلة.

الاستخدام المباشر:

https://my5353.com/30260

9. مجموعة بيانات حوار التعرف على النوايا متعدد الوسائط MIntRec2.0

MIntRec2.0 عبارة عن مجموعة بيانات مرجعية متعددة الوسائط ومتعددة الأطراف واسعة النطاق اقترحتها جامعة تسينغهوا وآخرون، والتي تُستخدم خصيصًا لتحديد النية في المحادثات واكتشاف المحتوى غير المقصود. بالمقارنة مع MIntRec السابق، زاد حجم البيانات في MIntRec2.0 إلى 15 ألفًا، وتغطي 30 فئة من النية، وتحتوي على ما يقرب من 9.3 ألف جملة توضيحية متعمدة و5.7 ألف جملة توضيحية غير متعمدة، وتتضمن وسائط متعددة مثل النص والفيديو والصوت.

الاستخدام المباشر:

https://my5353.com/30166

10. مجموعة بيانات ApolloCorpora الطبية متعددة اللغات

ApolloCorpora هي مجموعة بيانات طبية متعددة اللغات تم إنشاؤها بشكل مشترك من قبل معهد أبحاث البيانات الضخمة في شنتشن وفريق البحث في جامعة هونج كونج الصينية. وتغطي مجموعة البيانات ست لغات رئيسية يتحدث بها 6.1 مليار شخص حول العالم، بما في ذلك الإنجليزية والصينية والهندية والإسبانية والفرنسية والعربية.

الاستخدام المباشر:

https://my5353.com/30285

لمزيد من مجموعات البيانات العامة، يرجى زيارة:

https://hyper.ai/datasets

دروس تعليمية عامة مختارة

1. قم بتشغيل Deepmoney-34b-full عبر الإنترنت

Deepmoney هو مشروع نموذج لغوي واسع النطاق يركز على الاستثمارات في المجال المالي. تم تدريب Deepmoney-34b-full بناءً على نموذج Yi-34B-200K مفتوح المصدر 01-ai، والذي ينقسم إلى مرحلتين: pt (تدريب المعلمات الكامل) و sft (ضبط Lora الدقيق). يمكنك الآن استنساخه واستخدامه بنقرة واحدة على الموقع الرسمي لـSuper Neuro.

تشغيل عبر الإنترنت:

https://my5353.com/t30314

2. قم بتشغيل Deepmoney-miqu-70b عبر الإنترنت

تم تدريب هذا النموذج على أساس miqu-1-70b-sf الخاص بـ huggingface.co، مع تنفيذ SFT (ضبط Lora الدقيق) فقط. يمكنك الآن استنساخه واستخدامه بنقرة واحدة على الموقع الرسمي لـ SuperNeural.

تشغيل عبر الإنترنت:

https://my5353.com/t30314

3. قم بتشغيل Deepmoney-67b-full عبر الإنترنت

تم تدريب النموذج على أساس قاعدة deepseek-llm-67b مفتوحة المصدر بواسطة deepseek-ai. يتم تقسيمها إلى مرحلتين: pt (تدريب لورا) و sft (تدريب لورا). يمكنك الآن استنساخه واستخدامه بنقرة واحدة على الموقع الرسمي لـ SuperNeural.

تشغيل عبر الإنترنت:

https://my5353.com/t30310

مقالات المجتمع

1. أصدرت شركة NVIDIA Huang Renxun معالج GB200، الذي يتمتع بقدرة استدلال أعلى بمقدار 30 مرة من H100 واستهلاك طاقة أقل بمقدار 25 مرة، ويحول قدرات AI4S إلى خدمات مصغرة

أقيم مؤتمر GTC AI لعام 2024 في موعده المقرر. من 18 مارس إلى 21 مارس، كان هناك أكثر من 900 اجتماع وأكثر من 20 محاضرة تقنية. تلخص هذه المقالة الخطاب الرئيسي الذي ألقاه جينسن هوانغ في مؤتمر GTC.

شاهد التقرير الكامل:

https://my5353.com/p30224

2. إنتاج 120 ألف مادة مرشحة لالتقاط الكربون في 33 دقيقة، مختبر أرجون الوطني يُصدر إطار عمل للذكاء الاصطناعي التوليدي لتسريع ابتكار الأطر العضوية المعدنية

اقترح فريق بحثي من مختبر أرجون الوطني في الولايات المتحدة إطار عمل للذكاء الاصطناعي التوليدي GHP-MOFsassemble، والذي يمكنه إنشاء وتجميع هياكل MOFs جديدة بشكل عشوائي، وفحص هياكل MOFs عالية الاستقرار من خلال محاكاة الديناميكيات الجزيئية، واستخدام الشبكات العصبية البلورية (CGCNN) ومحاكاة مونت كارلو الكبرى (GCMC) لاختبار قدرة MOFs على الامتصاص لثاني أكسيد الكربون. وقد نُشرت الورقة ذات الصلة في مجلة "نيتشر".

شاهد التقرير الكامل:

https://my5353.com/p30269

3. جامعة برينستون تُصدر وحدة تحكم بالذكاء الاصطناعي تتنبأ بمخاطر تمزق البلازما قبل 300 ميلي ثانية

قام باحثون في جامعة برينستون بتطوير وحدة تحكم ذكاء اصطناعي للتنبؤ والتحكم التكيفي والتي يمكنها التنبؤ بالمخاطر المحتملة لتمزق البلازما قبل 300 ميلي ثانية والتدخل في الوقت المناسب. وقد نشرت النتائج ذات الصلة في مجلة "نيتشر".

شاهد التقرير الكامل:

https://my5353.com/p30296

مقالات موسوعية شعبية

1. جاذبية البيانات

2. فهم اللغة متعدد المهام الشامل (MMLU)

3. خليط من الخبراء (وزارة التعليم)

4. الشبكة العصبية الكمومية

5. مجال الإشعاع العصبي (NeRF)

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://hyper.ai/wiki

معاينة البث المباشر لمحطة B

تاريخوقتمحتوى
25 مارس
الاثنين
10:0017:00دورة التعلم العميق من معهد ماساتشوستس للتكنولوجيا 2020دورة التعلم العميق من معهد ماساتشوستس للتكنولوجيا 2021
الثلاثاء 26 مارس10:00تطوير واجهة برمجة التطبيقات (API) باستخدام Python - دورة شاملة للمبتدئين
الأربعاء 27 مارس10:0014:00دورة SQL التعليمية - دورة المبتدئين في الذكاء الاصطناعي التوليدي - الدورة الكاملة
الخميس 28 مارس21:00دورات Flutter للمبتدئين
الجمعة 29 مارس10:00دورات Flutter للمبتدئين
السبت 30 مارس10:00هارفارد CS50 - دورة الذكاء الاصطناعي بايثون
الأحد 31 مارس10:00تعلم PyTorch للتعلم العميق في يوم واحد

تبث قناة Super Neuro TV بثًا مباشرًا على مدار 24 ساعة طوال أيام الأسبوع. انقر للحصول على "المخللات الإلكترونية" في مجال الذكاء الاصطناعي:

http://live.bilibili.com/26483094

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة

* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 100 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai/