الملخص

يُعد نموذج GPT-4o نموذجًا أومنيًا ذاتي التوليد، يقبل كمدخلات أي توليفة من النصوص، والصوت، والصور، والفيديوهات، ويُنتج كمخرجات أي توليفة من النصوص، والصوت، والصور. تم تدريبه بشكل متكامل عبر النصوص، والرؤية، والصوت، ما يعني أن جميع المدخلات والمخرجات تُعالج بواسطة نفس الشبكة العصبية. ويُمكن لـ GPT-4o الاستجابة للمدخلات الصوتية في غضون 232 ميلي ثانية كحد أدنى، وبمتوسط 320 ميلي ثانية، وهو ما يشبه زمن الاستجابة البشري في المحادثات. ويُوازي أداء GPT-4o أداء GPT-4 Turbo في النصوص باللغة الإنجليزية والكود البرمجي، مع تحسن ملحوظ في النصوص باللغات غير الإنجليزية، إلى جانب سرعة أكبر وبتكلفة تقل بنسبة 50٪ في واجهة برمجة التطبيقات (API). ويتفوق GPT-4o بشكل خاص في فهم الرؤية والصوت مقارنة بالنماذج الحالية. وتماشيًا مع التزامنا ببناء الذكاء الاصطناعي بأمان، ووفقًا لالتزاماتنا الطوعية تجاه البيت الأبيض، نُقدّم بطاقة النظام الخاصة بـ GPT-4o، التي تتضمن تقييمات إطار الاستعداد لدينا. وفي هذه البطاقة، نقدّم نظرة مفصلة على قدرات GPT-4o، وقيوده، وتقييمات السلامة عبر فئات متعددة، مع التركيز على التحويل من الصوت إلى الصوت، إلى جانب تقييم القدرات النصية والبصرية، والتدابير التي اتخذناها لضمان سلامة النموذج وتوافقه مع القيم. كما نُدرج تقييمات من طرف ثالث حول القدرات الخطرة، بالإضافة إلى مناقشة التأثيرات الاجتماعية المحتملة لقدرات GPT-4o في النصوص والرؤية.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار