HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 13 أيام

TreeSynth: توليد بيانات متنوعة من الصفر عبر تقسيم الفضاء الفرعي بتوجيه شجري

Sheng Wang Pengan Chen Jingqi Zhou Qintong Li Jingwei Dong Jiahui Gao Boyang Xue Jiyue Jiang Lingpeng Kong Chuan Wu

TreeSynth: توليد بيانات متنوعة من الصفر عبر تقسيم الفضاء الفرعي بتوجيه شجري

الملخص

يتطلب تخصيص النماذج استخدام مجموعات بيانات عالية الجودة ومتنوعة، لكن جمع مثل هذه البيانات يظل عملية تستهلك وقتًا طويلاً وتفتقر إلى الكفاءة. وعلى الرغم من الإمكانات الكبيرة التي تمتلكها النماذج اللغوية الكبيرة (LLMs) في توليد البيانات، فإن النهج الحالي يعاني من قيود تتمثل في محدودية بيانات البذور، والتحيّزات المتأصلة في النموذج، وتنوع منخفض في أوامر التوليد، ما يؤدي إلى توزيعات محدودة التباين ومحفزة على التحيّز مع زيادة حجم البيانات. ولحل هذه التحديات، نقدّم "TREESYNTH"، وهي طريقة مبنية على فضاءات فرعية موجهة بأشجار، مستوحاة من أشجار القرار. حيث تُنشَأ شجرة لتقسيم الفضاء المكاني للفضاء الكامل الخاص بالمهام (أي العقدة الجذرية) بشكل تكراري إلى عدد كبير من الفضاءات الفرعية الأساسية (أي العقد الطرفية)، والتي تتميز بخصائص متميزة وغير متداخلة وشاملة بالكامل، وذلك لضمان التميّز والشمولية قبل توليد العينات داخل كل فضاء فرعي أساسي. وتُستخدم هذه الطريقة العالمية لتقسيم الفضاء ثم التوليد لجمع العينات من الفضاءات الفرعية في مجموعة بيانات شاملة، مما يُقلل بفعالية من التكرار وانهيار الفضاء، ويضمن تنوعًا عاليًا في توليد البيانات على نطاق واسع. علاوة على ذلك، تتيح شجرة التقسيم المكاني توزيع العينات على الفضاءات الفرعية الأساسية، ما يمكّن من إعادة توازن مجموعات البيانات الحالية لتحقيق توزيعات أكثر توازنًا وشمولية. من الناحية التجريبية، أظهرت تجارب واسعة النطاق على معايير متنوعة باستمرار تفوق أداء TREESYNTH في تنوع البيانات وأداء النموذج وقابلية التوسع القوية مقارنةً ببيانات تم إعدادها يدويًا وطرق التوليد البديلة، مع تحقيق متوسط تحسن في الأداء يصل إلى 10٪. كما تُبرز التحسينات المستمرة التي تحقّقها مجموعات البيانات المُعدّلة باستخدام TREESYNTH تطبيقاتها الفعّالة في إعادة توزيع البيانات الحالية لضمان تغطية أوسع وتحقيق تحسينات أداء ملحوظة. يُمكن الاطلاع على الشيفرة المصدرية على الرابط التالي: https://...

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
TreeSynth: توليد بيانات متنوعة من الصفر عبر تقسيم الفضاء الفرعي بتوجيه شجري | الأوراق البحثية | HyperAI