التاريخ

منذ 7 أشهر

المؤسسة

رابط الورقة البحثية

الوسوم

تم اقتراح خوارزمية Guess–Think–Answer (GTA) من قبل فريق خوارزمية مختبر الذكاء الاصطناعي في vivo في سبتمبر 2025، وتم نشر نتائج البحث ذات الصلة في الورقة البحثية "GTA: التعلم التعزيزي الموجه بالإشراف لتصنيف النصوص باستخدام نماذج لغوية كبيرة".

يعمل إطار عمل GTA بجعل النموذج يُولّد تخمينًا أوليًا (مُحسّنًا من خلال فقدان الإنتروبيا المتقاطعة)، ثم يُفكّر في هذا التخمين لتوليد الإجابة النهائية، مع استخدام مكافآت التعلم التعزيزي (RL) في الوقت نفسه لتشكيل الناتج النهائي وشكل هيكل GTA بأكمله. يُمكّن هذا الإطار النموذج من تعلّم أنماط الاستدلال الفعّالة تلقائيًا من خلال التعلم التعزيزي، مما يُلغي الحاجة إلى الشرح اليدوي لسلسلة الاستدلال، ويجمع بين كفاءة الضبط الدقيق المُشرف (SFT) والقدرات المُحسّنة للتعلم التعزيزي ضمن نموذج تدريب موحّد.

تعزيز الفكر الموجه

يمكن لتقنية GTR أن توجه عملية التفكير النموذجي في البيئات البصرية المعقدة وتمنع "انهيار الدماغ".

منذ 2 أشهر

التعلم أثناء النشر

LWD هو إطار عمل للتعلم المعزز على مستوى الأسطول من وضع عدم الاتصال إلى وضع الاتصال، والذي يمكّن الروبوتات ذات الأغراض العامة من جمع الخبرة باستمرار وتحقيق التطور الذاتي للسياسات.

منذ شهر واحد

وورلد جين

يتمتع برنامج WorldGen بالقدرة على إنشاء عوالم عرض في الوقت الفعلي موحدة هندسيًا وغنية بصريًا وعالية الكفاءة.

منذ 3 أشهر

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

يحل هذا النظام بفعالية التحديات الرئيسية في عملية المحاذاة الآمنة لـ LVLM.

منذ 3 أشهر

تمريرة أمامية مُفككة (DePass)

تُستخدم DePass لتفسير نموذج Transformer عن طريق تحليل المرور الأمامي.

منذ 3 أشهر

رسم شجرة فك تشفير رمز الرسالة المتفرقة

من خلال الاستفادة من التوازي في وحدة معالجة الرسومات لتوسيع شجرة فك التشفير بكفاءة، يتم تحقيق تحسين سريع وقابل للتوسع لمسار الاستدلال.

منذ 3 أشهر

حساء الخبراء في فئة SoCE

SoCE هو نموذج لتحسين النماذج يعتمد على آلية اختيار الخبراء التلقائية الواعية بالفئات ويتم دمجه مع مهام قياس الأداء المتعددة.

منذ 3 أشهر

طريقة التعرف على بصمات الأصابع iSeal

يحقق iSeal معدل نجاح بصمة 100% (FSR) ضد أكثر من 10 هجمات على 12 LLMs.

منذ 3 أشهر

كلب الصيد الكثيف

يُعد محرك البحث الكثيف مسؤولاً عن إيجاد الفقرات الأكثر صلة بدلالات الاستعلام بسرعة من مكتبة وثائق ضخمة، وهو المكون الأساسي لنظام توليد تحسين البحث.

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

تخمين – فكر – أجب

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تخمين – فكر – أجب

ذات صلة ويكي

تعزيز الفكر الموجه

التعلم أثناء النشر

وورلد جين

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

تمريرة أمامية مُفككة (DePass)

رسم شجرة فك تشفير رمز الرسالة المتفرقة

حساء الخبراء في فئة SoCE

طريقة التعرف على بصمات الأصابع iSeal

كلب الصيد الكثيف

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تخمين – فكر – أجب

ذات صلة ويكي

تعزيز الفكر الموجه

التعلم أثناء النشر

وورلد جين

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

تمريرة أمامية مُفككة (DePass)

رسم شجرة فك تشفير رمز الرسالة المتفرقة

حساء الخبراء في فئة SoCE

طريقة التعرف على بصمات الأصابع iSeal

كلب الصيد الكثيف

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة ويكي

تعزيز الفكر الموجه

التعلم أثناء النشر

وورلد جين

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

تمريرة أمامية مُفككة (DePass)

رسم شجرة فك تشفير رمز الرسالة المتفرقة

حساء الخبراء في فئة SoCE

طريقة التعرف على بصمات الأصابع iSeal

كلب الصيد الكثيف

ذات صلة ويكي

تعزيز الفكر الموجه

التعلم أثناء النشر

وورلد جين

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

تمريرة أمامية مُفككة (DePass)

رسم شجرة فك تشفير رمز الرسالة المتفرقة

حساء الخبراء في فئة SoCE

طريقة التعرف على بصمات الأصابع iSeal

كلب الصيد الكثيف