Command Palette
Search for a command to run...
بطاقة نظام GPT-4o
بطاقة نظام GPT-4o
الملخص
يُعد نموذج GPT-4o نموذجًا أومنيًا ذاتي التوليد، يقبل كمدخلات أي توليفة من النصوص، والصوت، والصور، والفيديوهات، ويُنتج كمخرجات أي توليفة من النصوص، والصوت، والصور. تم تدريبه بشكل متكامل عبر النصوص، والرؤية، والصوت، ما يعني أن جميع المدخلات والمخرجات تُعالج بواسطة نفس الشبكة العصبية. ويُمكن لـ GPT-4o الاستجابة للمدخلات الصوتية في غضون 232 ميلي ثانية كحد أدنى، وبمتوسط 320 ميلي ثانية، وهو ما يشبه زمن الاستجابة البشري في المحادثات. ويُوازي أداء GPT-4o أداء GPT-4 Turbo في النصوص باللغة الإنجليزية والكود البرمجي، مع تحسن ملحوظ في النصوص باللغات غير الإنجليزية، إلى جانب سرعة أكبر وبتكلفة تقل بنسبة 50٪ في واجهة برمجة التطبيقات (API). ويتفوق GPT-4o بشكل خاص في فهم الرؤية والصوت مقارنة بالنماذج الحالية. وتماشيًا مع التزامنا ببناء الذكاء الاصطناعي بأمان، ووفقًا لالتزاماتنا الطوعية تجاه البيت الأبيض، نُقدّم بطاقة النظام الخاصة بـ GPT-4o، التي تتضمن تقييمات إطار الاستعداد لدينا. وفي هذه البطاقة، نقدّم نظرة مفصلة على قدرات GPT-4o، وقيوده، وتقييمات السلامة عبر فئات متعددة، مع التركيز على التحويل من الصوت إلى الصوت، إلى جانب تقييم القدرات النصية والبصرية، والتدابير التي اتخذناها لضمان سلامة النموذج وتوافقه مع القيم. كما نُدرج تقييمات من طرف ثالث حول القدرات الخطرة، بالإضافة إلى مناقشة التأثيرات الاجتماعية المحتملة لقدرات GPT-4o في النصوص والرؤية.