اختيارات المحرر الأسبوعية | تشغيل نموذج Deepmoney المالي عبر الإنترنت، وتفضيلات الذكاء الاصطناعي ومجموعات البيانات عالية الجودة الأخرى عبر الإنترنت

في الوقت الحاضر، يتم تدريب معظم نتائج الأبحاث حول النماذج المالية في مجال الذكاء الاصطناعي على أساس المعرفة العامة. ومع ذلك، في الممارسة المالية الفعلية، فإن القدرة على تفسير هذه المعرفة العامة للسوق الحالية غالبا ما تكون غير كافية على نحو خطير. يجب أن يكون النموذج المالي الكبير المثالي قادرًا على فهم الأخبار أو أحداث البيانات وتقييمها على الفور من المنظورين الذاتي والكمي.
تم إنشاء Deepmoney لهذا الغرض. وهو مشروع نموذجي لغوي واسع النطاق يركز على الاستثمار في المجال المالي. يوفر الموقع الرسمي لـ hyper.ai الآن دروسًا تعليمية للتشغيل عبر الإنترنت، تعال وجربها!
من 18 مارس إلى 22 مارس، تحديثات الموقع الرسمي لـhyper.ai:
* مجموعات البيانات العامة عالية الجودة: 10
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3
* اختيار المقالات المجتمعية: 3 مقالات
* إدخالات الموسوعة الشعبية: 10
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. OpenHermesPreferences: مجموعة بيانات تفضيلات الذكاء الاصطناعي تم إنشاء مجموعة بيانات OpenHermesPreferences بواسطة Argilla بالتعاون مع فريق Hugging Face H4 وتحتوي على ما يقرب من مليون بيانات تفضيلات الذكاء الاصطناعي. يمكن استخدام مجموعة البيانات هذه لتدريب نماذج التفضيلات أو لمواءمة نماذج اللغة عبر تقنيات مثل تحسين التفضيلات المباشرة.
الاستخدام المباشر:
2. مجموعة بيانات محاذاة السياق الطويل LongAlign 10K ذات النموذج الكبير
LongAlign-10k هي مجموعة بيانات اقترحتها جامعة تسينغهوا لمعالجة التحديات التي تواجهها النماذج الكبيرة في مهام المحاذاة ذات السياق الطويل. يحتوي على 10000 من بيانات التعليمات الطويلة بطول يتراوح بين 8 كيلو بايت و64 كيلو بايت. تم تصميم مجموعة البيانات لتقييم أداء النماذج الكبيرة في السياقات الطويلة وقدرتها على اتباع تعليمات المهام التي يبلغ طولها من 10 آلاف إلى 100 ألف.
الاستخدام المباشر:
3. مجموعة بيانات تقييم الأمن السيبراني للنموذج الكبير CyberMetric
تحتوي مجموعة بيانات CyberMetric على 10000 سؤال مصممة لتقييم المعرفة المتعلقة بالأمن السيبراني للنماذج الكبيرة بشكل شامل. تم إنشاء مجموعة البيانات باستخدام نماذج كبيرة مختلفة وتم التحقق من صحتها من قبل خبراء في مجال الأمن السيبراني لضمان أهميتها ودقتها.
الاستخدام المباشر:
4. مجموعة بيانات خريطة محطة الطاقة الكهروضوئية الأرضية في الصين لعام 2020 بمقياس وطني 10 أمتار
قامت جامعة الزراعة الصينية، بالتعاون مع معهد العلوم الجغرافية وبحوث الموارد الطبيعية التابع للأكاديمية الصينية للعلوم، بتطوير طريقة رسم الخرائط الوطنية لمعالجة نقص البيانات عالية الدقة والمفتوحة المصدر حول توزيع محطات الطاقة الكهروضوئية الأرضية الوطنية في الصين. لقد أصدروا بنجاح مجموعة بيانات تصنيف محطات الطاقة الكهروضوئية الأرضية الوطنية بدقة 10 أمتار لعام 2020. ولا يكشف هذا الإنجاز بدقة عن خصائص التوزيع المكاني لمحطات الطاقة الكهروضوئية في بلدي فحسب، بل يوفر أيضًا موارد بيانات قيمة لتخطيط الطاقة واستخدام الأراضي ومراقبة الاستشعار عن بعد والبحث البيئي بدقة تصنيف تبلغ 89%. وتساهم هذه الخطوة في سد فجوة البيانات في هذا المجال في الصين، وهي ذات أهمية كبيرة للبحوث ذات الصلة.
الاستخدام المباشر:
5. تصنيف أمراض المحاصيل مجموعة بيانات صور تصنيف أمراض المحاصيل
تحتوي مجموعة البيانات على صور مصنفة لخمسة أمراض محاصيل، والتي تم تصنيفها على النحو التالي: ذبول الكسافا البكتيري (CBB)، ومرض خطوط الكسافا البنية (CBSD)، ومرض البقعة الخضراء في الكسافا (CGM)، ومرض فسيفساء الكسافا (CMD) والصحة. يمكن استخدامه لتدريب نماذج التعلم الآلي للكشف عن أمراض النبات، أو لتطوير خوارزميات لتشخيص النبات تلقائيًا.
الاستخدام المباشر:
6. الكشف عن أمراض أوراق الطماطم - مجموعة بيانات الكشف عن صور أمراض أوراق الطماطم
هذه المجموعة من البيانات عبارة عن مجموعة بيانات لكشف صور أمراض أوراق الطماطم. يتم تقسيم الصور إلى الفئات التالية: صحية، بقعة بكتيرية، اللفحة المبكرة، صحية، اللفحة المتأخرة، عفن الأوراق، نقطة الهدف، والبقعة السوداء. تم التعليق على الصور باستخدام تنسيق YOLO v5 PyTorch.
الاستخدام المباشر:
7. مجموعة بيانات مراجعات أمازون الكبيرة لعام 2023
AMAZON REVIEWS 2023 عبارة عن مجموعة بيانات واسعة النطاق لمراجعات أمازون تم جمعها بواسطة McAuley Lab في عام 2023، وتحتوي على أكثر من 570 مليون مراجعة و48 مليون منتج، تغطي 33 فئة مختلفة.
الاستخدام المباشر:
8. مجموعة بيانات تزوير الوجوه المُولّدة بواسطة نموذج انتشار DiFF
DiFF هي مجموعة بيانات عالية الجودة وواسعة النطاق لصور تزوير الوجوه تم تطويرها بشكل مشترك من قبل جامعة شاندونغ والجامعة الوطنية في سنغافورة ومؤسسات أخرى. يتم إنشاؤه بناءً على نموذج الانتشار ويحتوي على أكثر من 500000 صورة. تعتبر مجموعة البيانات هذه مناسبة لاكتشاف تزوير الوجه والهجمات المعادية والدفاعات ضد التزييف العميق وغيرها من مهام تدريب الرؤية الحاسوبية ذات الصلة.
الاستخدام المباشر:
9. مجموعة بيانات حوار التعرف على النوايا متعدد الوسائط MIntRec2.0
MIntRec2.0 عبارة عن مجموعة بيانات مرجعية متعددة الوسائط ومتعددة الأطراف واسعة النطاق اقترحتها جامعة تسينغهوا وآخرون، والتي تُستخدم خصيصًا لتحديد النية في المحادثات واكتشاف المحتوى غير المقصود. بالمقارنة مع MIntRec السابق، زاد حجم البيانات في MIntRec2.0 إلى 15 ألفًا، وتغطي 30 فئة من النية، وتحتوي على ما يقرب من 9.3 ألف جملة توضيحية متعمدة و5.7 ألف جملة توضيحية غير متعمدة، وتتضمن وسائط متعددة مثل النص والفيديو والصوت.
الاستخدام المباشر:
10. مجموعة بيانات ApolloCorpora الطبية متعددة اللغات
ApolloCorpora هي مجموعة بيانات طبية متعددة اللغات تم إنشاؤها بشكل مشترك من قبل معهد أبحاث البيانات الضخمة في شنتشن وفريق البحث في جامعة هونج كونج الصينية. وتغطي مجموعة البيانات ست لغات رئيسية يتحدث بها 6.1 مليار شخص حول العالم، بما في ذلك الإنجليزية والصينية والهندية والإسبانية والفرنسية والعربية.
الاستخدام المباشر:
لمزيد من مجموعات البيانات العامة، يرجى زيارة:
دروس تعليمية عامة مختارة
1. قم بتشغيل Deepmoney-34b-full عبر الإنترنت
Deepmoney هو مشروع نموذج لغوي واسع النطاق يركز على الاستثمارات في المجال المالي. تم تدريب Deepmoney-34b-full بناءً على نموذج Yi-34B-200K مفتوح المصدر 01-ai، والذي ينقسم إلى مرحلتين: pt (تدريب المعلمات الكامل) و sft (ضبط Lora الدقيق). يمكنك الآن استنساخه واستخدامه بنقرة واحدة على الموقع الرسمي لـSuper Neuro.
تشغيل عبر الإنترنت:
2. قم بتشغيل Deepmoney-miqu-70b عبر الإنترنت
تم تدريب هذا النموذج على أساس miqu-1-70b-sf الخاص بـ huggingface.co، مع تنفيذ SFT (ضبط Lora الدقيق) فقط. يمكنك الآن استنساخه واستخدامه بنقرة واحدة على الموقع الرسمي لـ SuperNeural.
تشغيل عبر الإنترنت:
3. قم بتشغيل Deepmoney-67b-full عبر الإنترنت
تم تدريب النموذج على أساس قاعدة deepseek-llm-67b مفتوحة المصدر بواسطة deepseek-ai. يتم تقسيمها إلى مرحلتين: pt (تدريب لورا) و sft (تدريب لورا). يمكنك الآن استنساخه واستخدامه بنقرة واحدة على الموقع الرسمي لـ SuperNeural.
تشغيل عبر الإنترنت:
مقالات المجتمع
أقيم مؤتمر GTC AI لعام 2024 في موعده المقرر. من 18 مارس إلى 21 مارس، كان هناك أكثر من 900 اجتماع وأكثر من 20 محاضرة تقنية. تلخص هذه المقالة الخطاب الرئيسي الذي ألقاه جينسن هوانغ في مؤتمر GTC.
شاهد التقرير الكامل:
اقترح فريق بحثي من مختبر أرجون الوطني في الولايات المتحدة إطار عمل للذكاء الاصطناعي التوليدي GHP-MOFsassemble، والذي يمكنه إنشاء وتجميع هياكل MOFs جديدة بشكل عشوائي، وفحص هياكل MOFs عالية الاستقرار من خلال محاكاة الديناميكيات الجزيئية، واستخدام الشبكات العصبية البلورية (CGCNN) ومحاكاة مونت كارلو الكبرى (GCMC) لاختبار قدرة MOFs على الامتصاص لثاني أكسيد الكربون. وقد نُشرت الورقة ذات الصلة في مجلة "نيتشر".
شاهد التقرير الكامل:
3. جامعة برينستون تُصدر وحدة تحكم بالذكاء الاصطناعي تتنبأ بمخاطر تمزق البلازما قبل 300 ميلي ثانية
قام باحثون في جامعة برينستون بتطوير وحدة تحكم ذكاء اصطناعي للتنبؤ والتحكم التكيفي والتي يمكنها التنبؤ بالمخاطر المحتملة لتمزق البلازما قبل 300 ميلي ثانية والتدخل في الوقت المناسب. وقد نشرت النتائج ذات الصلة في مجلة "نيتشر".
شاهد التقرير الكامل:
مقالات موسوعية شعبية
1. جاذبية البيانات
2. فهم اللغة متعدد المهام الشامل (MMLU)
3. خليط من الخبراء (وزارة التعليم)
4. الشبكة العصبية الكمومية
5. مجال الإشعاع العصبي (NeRF)
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
معاينة البث المباشر لمحطة B
تاريخ | وقت | محتوى |
25 مارس الاثنين | 10:0017:00 | دورة التعلم العميق من معهد ماساتشوستس للتكنولوجيا 2020دورة التعلم العميق من معهد ماساتشوستس للتكنولوجيا 2021 |
الثلاثاء 26 مارس | 10:00 | تطوير واجهة برمجة التطبيقات (API) باستخدام Python - دورة شاملة للمبتدئين |
الأربعاء 27 مارس | 10:0014:00 | دورة SQL التعليمية - دورة المبتدئين في الذكاء الاصطناعي التوليدي - الدورة الكاملة |
الخميس 28 مارس | 21:00 | دورات Flutter للمبتدئين |
الجمعة 29 مارس | 10:00 | دورات Flutter للمبتدئين |
السبت 30 مارس | 10:00 | هارفارد CS50 - دورة الذكاء الاصطناعي بايثون |
الأحد 31 مارس | 10:00 | تعلم PyTorch للتعلم العميق في يوم واحد |
تبث قناة Super Neuro TV بثًا مباشرًا على مدار 24 ساعة طوال أيام الأسبوع. انقر للحصول على "المخللات الإلكترونية" في مجال الذكاء الاصطناعي:
http://live.bilibili.com/26483094
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة
* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت
* تفسير أكثر من 100 حالة بحثية من AI4Science
* دعم البحث عن أكثر من 500 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك: