منذ 6 أشهر

Andy Zou Long Phan Sarah Chen James Campbell Phillip Guo Richard Ren Alexander Pan Xuwang Yin Mantas Mazeika Ann-Kathrin Dombrowski

الملخص

في هذه الورقة، نحدد ونُصَفُّ المجال الناشئ لـ "هندسة التمثيل" (RepE)، وهو نهج يهدف إلى تعزيز الشفافية في أنظمة الذكاء الاصطناعي، مستمدًا رؤى من علم الأعصاب المعرفي. تُركّز RepE على التمثيلات على مستوى المجموعة (population-level representations) بدلًا من الأعصاب أو الدوائر، مما يزوّدنا بأساليب جديدة لرصد وتعديل الظواهر المعرفية عالية المستوى في الشبكات العصبية العميقة (DNNs). نقدّم معايير مرجعية وتحليلًا أوليًا لتقنيات RepE، موضحين أن هذه الأساليب تقدّم حلولًا بسيطة ولكن فعّالة لتحسين فهمنا وتحكمنا في النماذج اللغوية الكبيرة. ونُظهر كيف يمكن لهذه الأساليب أن تُسهم في معالجة طائفة واسعة من المشكلات ذات الصلة بالسلامة، بما في ذلك الصدق، والخضوع للضرر، وسعي الكيانات للسلطة، وغيرها، مما يُظهر إمكانات البحث الشفافي من الأعلى إلى الأسفل. نأمل أن تُحفّز هذه الدراسة استكشافًا أوسع لـ RepE، وتدعم تقدّمًا في شفافية وسلامة أنظمة الذكاء الاصطناعي.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

HyperAI

منذ 6 أشهر

معالجة اللغة الطبيعية

الشبكات العصبية

متعدد التخصصات/شامل/ناشئ

مجال البحث

النهج/المعمارية

معالجة اللغة الطبيعية

مهمة

Andy Zou Long Phan Sarah Chen James Campbell Phillip Guo Richard Ren Alexander Pan Xuwang Yin Mantas Mazeika Ann-Kathrin Dombrowski

الملخص

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

هندسة التمثيل: نهج من الأعلى إلى الأسفل للشفافية في الذكاء الاصطناعي

Andy Zou Long Phan Sarah Chen James Campbell Phillip Guo Richard Ren Alexander Pan Xuwang Yin Mantas Mazeika Ann-Kathrin Dombrowski11 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

هندسة التمثيل: نهج من الأعلى إلى الأسفل للشفافية في الذكاء الاصطناعي

Andy Zou Long Phan Sarah Chen James Campbell Phillip Guo Richard Ren Alexander Pan Xuwang Yin Mantas Mazeika Ann-Kathrin Dombrowski11 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

هندسة التمثيل: نهج من الأعلى إلى الأسفل للشفافية في الذكاء الاصطناعي

Andy Zou Long Phan Sarah Chen James Campbell Phillip Guo Richard Ren Alexander Pan Xuwang Yin Mantas Mazeika Ann-Kathrin Dombrowski11 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Andy Zou Long Phan Sarah Chen James Campbell Phillip Guo Richard Ren Alexander Pan Xuwang Yin Mantas Mazeika Ann-Kathrin Dombrowski

Andy Zou Long Phan Sarah Chen James Campbell Phillip Guo Richard Ren Alexander Pan Xuwang Yin Mantas Mazeika Ann-Kathrin Dombrowski

Andy Zou Long Phan Sarah Chen James Campbell Phillip Guo Richard Ren Alexander Pan Xuwang Yin Mantas Mazeika Ann-Kathrin Dombrowski