HyperAI

اختيارات المحرر الأسبوعية | تم إطلاق مجموعة بيانات معيارية FewJoint، وأصدرت إدارة الإشراف بوزارة العلوم والتكنولوجيا لوائح جديدة للذكاء الاصطناعي

特色图像

يشير التعلم من خلال عدد قليل من اللقطات إلى القدرة على تعلم وإتقان مهام جديدة باستخدام عدد قليل جدًا من العينات، تمامًا مثل البشر. لقد أصبح هذا المجال موضوعًا ساخنًا في مجتمع التعلم الآلي ويعتبر أحد الاتجاهات الرئيسية لدفع الذكاء الآلي إلى ما يقرب من الذكاء البشري.أطلق معهد هاربين للتكنولوجيا مجموعة بيانات معيارية FewJoint، والتي توفر معيار تقييم عام لتقييم معالجة اللغة الطبيعية (NLP) على عينة صغيرة.أصبحت مجموعة البيانات هذه متاحة الآن على hyper.ai. تتوفر المزيد من مجموعات بيانات معالجة اللغة الطبيعية للتدريب على النماذج الصينية الكبيرة للتنزيل على hyper.ai. دعونا نلقي نظرة!

من 29 يناير إلى 2 فبراير، تحديثات الموقع الرسمي لـhyper.ai:

* مجموعات البيانات العامة عالية الجودة: 10

* حافظات ورق AI4S: 3

* إدخالات الموسوعة الشعبية: 10

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1مجموعة بيانات مرجعية صغيرة من FewJoint

مجموعة بيانات معيار FewJoint عبارة عن مجموعة من بيانات المستخدم الحقيقي وبيانات تم إنشاؤها بواسطة خبراء من منصة iFlytek AIUI المفتوحة (بنسبة تقريبية تبلغ 3:7). إنه يغطي 59 نطاقًا حقيقيًا وهو حاليًا أحد مجموعات بيانات المحادثة التي تحتوي على أكبر عدد من النطاقات.

الاستخدام المباشر:

https://hyper.ai/datasets/29239

2. مجموعة بيانات حوكمة النموذج الصيني الكبير 100 PoisonMpts

100 PoisonMpts هي أول مجموعة بيانات صينية مفتوحة المصدر لحوكمة نموذج اللغة على نطاق واسع في الصناعة. يشكل العشرات من الخبراء والعلماء المشهورين الدفعة الأولى من مهندسي التعليقات التوضيحية "100 زجاجة سم للذكاء الاصطناعي". قام كل معلق بطرح 100 سؤال صعب أدت إلى إجابات متحيزة وتمييزية، وقاموا بشرح إجابات النموذج الكبير، واستكملوا الهجوم والدفاع باستخدام الذكاء الاصطناعي من "التسميم" إلى "إزالة السموم".

الاستخدام المباشر:

https://hyper.ai/datasets/29203

3. مجموعة بيانات معيار تقييم فهم اللغة الصينية CLUE

CLUE (معيار تقييم فهم اللغة الصينية) عبارة عن مجموعة بيانات تستخدم للتدريب والتحقق واختبار مهام فهم قواعد اللغة الصينية.

الاستخدام المباشر:

https://hyper.ai/datasets/29094

4. ويكيبيديا مجموعة بيانات ويكيبيديا

تم إنشاء مجموعة البيانات هذه من تفريغات ويكيبيديا، مع مجموعة فرعية واحدة لكل لغة وكل مجموعة فرعية متصلة بتقسيم العمود. يحتوي كل مثال على محتوى مقالة ويكيبيديا كاملة، تم تنظيفها لإزالة العلامات والأجزاء غير المرغوب فيها (مثل "المراجع"، وما إلى ذلك).

الاستخدام المباشر:

https://hyper.ai/datasets/28528

5. مجموعة الإنترنت الصينية CCI

تتكون شبكة الإنترنت الصينية للشركات (CCI) من مصادر عالية الجودة وموثوقة من مواقع الإنترنت في البر الرئيسي للصين. تخضع CCI لعملية تنظيف صارمة للبيانات وإزالة التكرارات، وتجري اختبارات وتصفية مستهدفة لجودة المحتوى.

الاستخدام المباشر:

https://hyper.ai/datasets/29186

6. بيلة الفينيل كيتون  مجموعة بيانات تقسيم الكلمات الصينية المبسطة

تدمج مجموعة بيانات SIGHAN 2005، وهي التقييم الدولي التلقائي لتجزئة الكلمات الصينية (تقييم SIGHAN باختصار)، مجموعات بيانات تجزئة الكلمات من مؤسسات متعددة. تم إصدار هذه المجموعة من البيانات بشكل مشترك من قبل Microsoft Research China وجامعة بكين وجامعة مدينة هونج كونج وأكاديمية سينيكا في تايوان، ويتم استخدامها لتدريب وتقييم نماذج تقسيم الكلمات الصينية. ومن بينها، PKU هي مجموعة بيانات مبسطة لتجزئة الكلمات الصينية.

الاستخدام المباشر:

https://hyper.ai/datasets/29168

7. الشعر الصيني قاعدة البيانات الأكثر شمولاً للشعر الكلاسيكي الصيني

تُعد هذه المجموعة من البيانات حاليًا قاعدة البيانات الأكثر اكتمالاً للأدب الكلاسيكي الصيني، بما في ذلك 55000 قصيدة من عهد أسرة تانغ، و260000 قصيدة من عهد أسرة سونغ، و21000 قصيدة من عهد أسرة سونغ وغيرها من الأدب الكلاسيكي. وتضم المجموعة الشعرية ما يقرب من 14 ألف شاعر قديم من أسرتي تانغ وسونغ، و1.5 ألف شاعر غنائي قديم من أسرة سونغ. البيانات تأتي من الإنترنت.

الاستخدام المباشر:

https://hyper.ai/datasets/29257

8. مجموعة بيانات فهم القراءة الصينية PD&CFT

تُعد مجموعة البيانات هذه أول مجموعة بيانات لفهم القراءة باللغة الصينية، والتي تتضمن محتوى نصيًا من صحيفة الشعب اليومية وحكايات الأطفال الخيالية (PD&CFT).

الاستخدام المباشر:

https://hyper.ai/datasets/29260

للحصول على المزيد من مجموعات البيانات المحدثة هذا الأسبوع، يرجى زيارة:

https://hyper.ai/datasets

العلوم والذكاء الاصطناعي  دراسات حالة مختارة

1.ارتفعت دقة التشخيص المبكر لمرض باركنسون إلى 90.2%. اقترح معهد شنتشن للتكنولوجيا المتقدمة ومستشفى تشونغشان الأول بشكل مشترك نموذج GSP-GCNs

اقترح فريق بحثي من المستشفى التابع الأول لجامعة صن يات صن ومعهد التكنولوجيا المتقدمة بجامعة تكنولوجيا صن يات صن نموذجًا للتعلم العميق - معالجة إشارة الرسم البياني - شبكات التفافية للرسم البياني (GSP-GCNs)، والذي يستخدم بيانات تخطيط كهربية الدماغ المرتبطة بالأحداث والتي تم الحصول عليها من مهام محددة تتضمن تنظيم النغمة لتشخيص مرض باركنسون. وقد نُشرت الورقة البحثية ذات الصلة في مجلة "Nature".

شاهد التقرير الكامل:

https://hyper.ai/news/29189

2. وزارة العلوم والتكنولوجيا تتخذ الإجراءات اللازمة! دليل مستخدم AIGC للباحثين موجود هنا، والمجتمع الأكاديمي يبدأ في الحماية من مسلحي الذكاء الاصطناعي

في 21 ديسمبر 2023، أصدرت إدارة الإشراف بوزارة العلوم والتكنولوجيا "المبادئ التوجيهية لسلوك البحث المسؤول (2023)"، والتي تنظم تطبيق الذكاء الاصطناعي والتقنيات الأخرى في البحث العلمي استجابة للقضايا الساخنة ذات الاهتمام الاجتماعي مثل الذكاء الاصطناعي وإصدار النتائج الرئيسية.

شاهد التقرير الكامل:

https://hyper.ai/news/29228

3. نُشرت ورقة بحثية من معهد أشباه الموصلات التابع للأكاديمية الصينية للعلوم في المجلة الرائدة لـ TNNLS مرة أخرى، مما ساهم في تقديم منظور جديد لاستكشاف التعبيرات الرياضية

اعتبر باحثون من معهد أشباه الموصلات التابع للأكاديمية الصينية للعلوم حل بنية التعبير كمشكلة تصنيف وحلوها من خلال التعلم الخاضع للإشراف، واقترحوا شبكة رمزية تسمى DeepSymNet لتمثيل التعبيرات الرمزية. بالمقارنة مع العديد من خوارزميات SR الشائعة المستندة إلى التعلم الخاضع للإشراف، يستخدم DeepSymNet تسميات أقصر، ويقلل من مساحة البحث التنبؤي، ويحسن من قوة الخوارزمية. وقد تم نشر أوراق ذات صلة في مجلة "IEEE".

شاهد التقرير الكامل:

https://hyper.ai/news/29243

مقالات موسوعية شعبية

1. التعلم التمثيلي

2. الذاكرة طويلة المدى والذاكرة قصيرة المدى الذاكرة طويلة المدى

3. طريقة المربعات الصغرى

4. الحوسبة الشبكية الحوسبة الشبكية

5. اندماج الرتب المتبادل (RRF)

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://hyper.ai/wiki

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد ترغب في تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* توفير عقد تنزيل محلية سريعة لأكثر من 1200 مجموعة بيانات عامة

* يتضمن أكثر من 300 برنامج تعليمي كلاسيكي وشائع عبر الإنترنت

* تفسير أكثر من 100 حالة بحثية من AI4Science

* دعم البحث عن أكثر من 500 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai/