القتال في Google I/O؟ سوف يقوم OpenAI بالبث المباشر قبل يوم واحد، وقد يكون لدى ChatGPT وظيفة الاتصال

من المتوقع أن تكون دائرة الذكاء الاصطناعي حيوية للغاية هذا الأسبوع.
في 13 مايو بالتوقيت المحلي، ستقوم OpenAI ببث مباشر لإصدار التحديثات الخاصة بـ ChatGPT وGPT-4. في اليوم التالي، وصل مؤتمر Google I/O في موعده المقرر. على عكس مؤتمر I/O الذي يعد الحدث السنوي لشركة Google، فإن الإصدار المؤقت لـ OpenAI هذه المرة يعد بمثابة ضجة إعلامية إلى حد ما. فكيف سيتصرف هذا "المنافس القديم" منذ زمن طويل هذه المرة؟ دعونا نراجع أصول الحزبين ونقدم بعض التخمينات الجريئة!
جولات متعددة من المواجهة والمعركة على قدم وساق
منذ أن حققت OpenAI ضجة كبيرة، تم تصنيف Google على أنها "محبطة" و"بداية بطيئة" و"مواكبة للركب".الأكثر استحقاقًا للاستكشاف هو عنوان "أكاديمية AI Huangpu العسكرية".يبدو الأمر وكأنه مديح، لكنه في الحقيقة "دموع المرارة" من جوجل.
كما نعلم جميعًا، فإن ChatGPT، الذي وضع الأساس لـ OpenAI، يعتمد على بنية Transformer.المحول هو الهندسة المعمارية الرائدة التي اقترحتها جوجل في ورقة بحثية بعنوان "الاهتمام هو كل ما تحتاجه".بالإضافة إلى ذلك، ظهر العديد من مديري Google السابقين في الشكر على واجهة إصدار ChatGPT، وبعد ذلك انتقل العديد من موظفي Google الأساسيين إلى OpenAI... والأمر الأكثر إثارة للاهتمام هو أنه في كل مرة تحاول فيها Google "الرد"، توجد دائمًا بعض الحلقات الصغيرة.
في فبراير 2023، اقترحت Google على Bard التعامل مع ChatGPT.ولكن بعد وقت قصير من نشرها، تم الكشف عن وجود أخطاء واقعية في العرض.
ردًا على السؤال "ماذا يمكنني أن أخبر ابني البالغ من العمر 9 سنوات عن تلسكوب جيمس ويب الفضائي (JWST) وما اكتشفه؟" أجاب بارد: لقد تم التقاط أول صورة لكوكب خارج المجموعة الشمسية بواسطة تلسكوب جيمس ويب. لكن جرانت تريمبلاي، الباحث في مركز هارفارد سميثسونيان للفيزياء الفلكية، يشير إلى أن التلسكوب العملاق للغاية التابع للمرصد الجنوبي الأوروبي هو الذي التقط أول صورة لكوكب خارج المجموعة الشمسية في عام 2004.
في مؤتمر I/O في مايو 2023، استعرضت Google ترقيات منتجات Bard.على سبيل المثال، فهو يدعم المزيد من اللغات، ويتعرف على معلومات الصور، ويتصل بتطبيقات Google وبعض التطبيقات الخارجية، وما إلى ذلك. وفي الوقت نفسه، أصدرت Google أيضًا PaLM2، وهو منتج مماثل لـ GPT-4، والذي يتضمن تحسينات في الرياضيات والترميز والمنطق وتوليد اللغة الطبيعية.
وبناءً على ذلك، أنشأ فريق أبحاث Google Health أيضًا Med-PaLM 2، الذي يتمتع بوظائف مثل استرجاع المعرفة الطبية وفك تشفير المصطلحات الطبية. وكما كان متوقعًا، قامت جوجل بدمج قدرات الذكاء الاصطناعي الخاصة بها في سيناريوهات المكتب مثل كتابة النصوص وإنشاء جداول البيانات، وأطلقت Google Workspace، الذي يضاهي GPT من حيث النموذج ومايكروسوفت من حيث التطبيق.
وبعد ذلك، قام العديد من مستخدمي الإنترنت بمقارنة PaLM 2 مع GPT-4 في أشكال مختلفة، وكان من المرجح أن يكون OpenAI في المقدمة.
في ديسمبر 2023، أطلقت Google نموذج Gemini، وهو "أكبر وأقوى" نموذج للذكاء الاصطناعي.إن تأثير العرض مذهل بالفعل، والإصدار المتطور قادر على التنافس مع GPT-4 في الأداء. ومع ذلك، فقد تبين أن الفيديو التوضيحي خضع لمعالجة لاحقة، وأن التأثير كان مبالغًا فيه جزئيًا.
في 8 فبراير 2024، أعلنت شركة جوجل أنه سيتم تغيير اسم Bard رسميًا إلى Gemini.كما أصبح Chatbot Gemini Advanced، الذي يعمل بنموذجه الأقوى Gemini Ultra، متاحًا رسميًا أيضًا، بنفس "الإيجار الشهري" البالغ 20 دولارًا مثل ChatGPT، والذي يبدو وكأنه منافسة. والأهمية الأكبر لهذا الإصدار هي أن Google AI سيتم توحيده في Gemini، وهو اسم النموذج واسم المنتج.
في 16 فبراير 2024، بعد أيام قليلة من إطلاق أقوى إصدار لها وهو Gemini 1.0 Ultra، أطلقت Google إصدار Gemini 1.5 دفعة واحدة.ومن بينها، يمكن لـ Gemini 1.5 Pro دعم ما يصل إلى مليون رمز من السياق الطويل للغاية، مما يسحق GPT-4 من حيث عدد الرموز، وبالتالي تحقيق أداء ممتاز في المهام مثل معالجة الصوت والفيديو. إذا لم يكن الأمر يتعلق بـ Sora، فمن المحتمل أن يكون Gemini 1.5 موضوعًا ساخنًا في دائرة الذكاء الاصطناعي لفترة طويلة.
بعد ساعات قليلة من إصدار Gemini 1.5، أصدرت OpenAI نموذج الفيديو Vincent Sora.بفضل قدراتها غير المسبوقة في توليد الفيديو، فقد احتلت مركز الصدارة على الفور، وسرق مقطع الفيديو التوضيحي الذي تبلغ مدته دقيقة واحدة الأضواء من جيميني.
في هذه الجولة، لا توجد مقارنة من حيث التكنولوجيا، ولكن الفائز يتم تحديده بوضوح من حيث الشعبية. كما عززت OpenAI مكانتها بشكل أكبر بمساعدة Sora.
هل ستخطف OpenAI الأضواء مرة أخرى؟
ومن الجدير بالذكر أنه في الأول من مايو، كسر مستخدم الإنترنت جيمي أبلز الخبر:من المتوقع أن يتم إطلاق محرك البحث OpenAI في 9 مايو.تنبأ أحد مستخدمي الإنترنت بشكل دقيق بتاريخ إصدار GPT-4. وفي وقت لاحق، قال إن موعد الإصدار تم تأجيله إلى 13 مايو.
وفي 8 مايو، ذكرت بلومبرج أيضًا أن OpenAI تعمل على تطوير محرك بحث جديد داخليًا، والذي سيجلب تجربة بحث جديدة من خلال أساليب الإجابة على الأسئلة المولدة بواسطة الذكاء الاصطناعي. وقالت بلومبرج إن إحدى ميزات محرك البحث هي قدرته على الإجابة على الأسئلة باستخدام النص المكتوب والصور. وذكرت بلومبرج أن منتج البحث الخاص بشركة OpenAI هو امتداد لمنتجها الرائد ChatGPT، مما يتيح لـ ChatGPT الحصول على المعلومات مباشرة من الويب، بما في ذلك الاستشهادات. وفي تقارير سابقة، كشف موقع The Verge عن هذا الخبر.تسعى شركة OpenAI إلى استقطاب المهندسين من قسم البحث في Google لتسريع إطلاق منتجات البحث بالذكاء الاصطناعي.
هل يبدو تحرك OpenAI لاستهداف قطاع البحث المستقر بالفعل أشبه بـ "مهاجمة التنين بشكل مباشر"؟
ومع ذلك، في 11 مايو، غردت OpenAI رسميًا بأن المؤتمر الصحفي الذي سيعقد في الثالث عشر من الشهر سيحمل فقط تحديثات إلى ChatGPT وGPT-4، دون ذكر "محرك البحث" على الإطلاق. لكن تاريخ 13 مايو مثير للاهتمام للغاية لأن Google أعلنت بالفعل أنها ستعقد مؤتمر Google I/O في 14 مايو.

ثم كشف سام ألتمان عن أوراقه بشكل مباشر -ليس GPT-5، وليس محرك بحث،لكننا نعمل دائمًا على بعض الأشياء الجديدة التي نعتقد أن الناس سيحبونها! إنه مثل السحر بالنسبة لي.

بعد أن قام سام ألتمان بإزالة إجابتين خاطئتين، ظل مستخدمو الإنترنت متحمسين لتخمين "ما ستصدره OpenAI"، وتم الكشف عن المزيد من الأدلة، بما في ذلك التفاعل الصوتي.
وبحسب موقع The Information، فقد أظهرت شركة OpenAI لمستخدميها نموذجًا جديدًا يمكنه المحادثة والتعرف على الأشياء، مما يوفر فهمًا أسرع وأكثر دقة للصورة والصوت. وبحسب موقع The Verge، قال المطور Ananay Arora إن ChatGPT قد يحتوي على ميزة الاتصال. ووجد أرورا أيضًا أدلة على أن OpenAI قدمت خوادم للاتصالات الصوتية والفيديو في الوقت الفعلي.

وبالإضافة إلى ذلك، نشر المؤسس المشارك لشركة Halliday، indigo، تنبؤًا أكثر تفصيلاً على حسابه على Twitter (X)، حيث لم يذكر GPT-4.5 فحسب، بل توقع أيضًا أن المساعد الذكي AI الجديد من OpenAI سيدعم التفاعل الصوتي الكامل.

ومع ذلك، من منظور معين،على الرغم من أن سام ألتمان نفى وجود "محرك البحث"، إلا أنه لم يقل إنه لن يضيف "ميزة البحث" إلى ChatGPT.في الواقع، في الآونة الأخيرة، قام مستخدمو الإنترنت بجمع الكثير من الأدلة التي تشير إلى دخول OpenAI إلى مجال البحث.
أولاً، كشف الخبر ليور إس، الباحث السابق في ميلا والمحاضر في معهد ماساتشوستس للتكنولوجيا.يُظهر أحدث سجل لشهادة SSL من OpenAI أنه تم إنشاء المجال الفرعي search.chatgpt.com.

تلقى بعض مستخدمي الإنترنت في الصين اختبار التدرج الرمادي، ونشرت "Cyber Zen Heart" نتائج التجربة على حسابها الرسمي:


كما ترى، إجابات ChatGPT دقيقة تمامًا، ويقول Cyber Zen Heart أن سرعة الإجابة الخاصة به مقبولة أيضًا. لكن،ChatGPT ليس جيدًا في الحصول على المعلومات في الوقت الفعلي.قام Cyber Zen بالبحث عن أسعار البيتكوين ومقارنتها بالأسعار الموجودة على جوجل:


بالإضافة إلى ذلك، قام أحد مستخدمي الإنترنت بنشر عرض توضيحي على تويتر يدعي أنه صفحة البحث الرسمية للذكاء الاصطناعي OpenAI، لكنه مختلف تمامًا عن واجهة الاختبار ذات التدرج الرمادي:

في الوقت الحاضر، لا يزال من غير المعروف ما إذا كان منتج البحث الخاص بشركة OpenAI سيتم إصداره في النهاية للجمهور في شكل اختبار تدرج الرمادي. وبشكل عام، فإن المنافسين الذين تواجههم ليسوا جوجل فقط، بل أيضًا شركة Perplexity AI. في الحقيقة،بمعنى ما، فإن Perplexity AI هو المنتج الذي يجب على OpenAI التنافس معه بشكل مباشر في مجال البحث.
اليوم، أصبحت أداة الذكاء الاصطناعي هذه، التي تدعي أنها "أول محرك بحث محادثة في العالم"، في دائرة الضوء وتلقت الدعم من جينسن هوانج والاستثمار من كبار الشخصيات مثل بيزوس. تكمن تفرده في الجمع بين أسلوب الأسئلة والأجوبة على غرار ChatGPT وقائمة الروابط لمحركات البحث التقليدية.

بأي شكل ستشارك OpenAI في منافسة سوق محركات البحث في عصر الذكاء الاصطناعي؟ دعونا ننتظر ونرى ما إذا كان سيتم الكشف عن وظيفة البحث الخاصة بـ ChatGPT في المؤتمر الصحفي في 13 مايو.
هل يمكن لـ Google I/O الاعتماد فقط على Gemini لتولي زمام المبادرة؟
يبقى أن نرى ما إذا كان المؤتمر الصحفي لشركة OpenAI سيكشف عن أي تحديثات رئيسية، عن قصد أو عن غير قصد، ولكنني أعتقد أن Google ستشاهد البث المباشر في الوقت المحدد بالتأكيد. إذا كانت هناك مفاجأة، أتساءل عما إذا كان بيتشاي سيكون قادرًا على الاستجابة بسرعة والقتال في الوقت المناسب في مؤتمر Google I/O في اليوم التالي؟
وبالمقارنة، يفتقر مؤتمر Google I/O السنوي إلى بعض الغموض. وتتمحور مواضيع المؤتمر التي تم الإعلان عنها على صفحتها الرسمية حول - الهاتف المحمول، والويب، والتعلم الآلي والذكاء الاصطناعي، والسحابة.

كما جرت العادة، سيشارك الرئيس التنفيذي للشركة، سوندار بيتشاي، تحديثات أندرويد، ومنتجات الأجهزة من الجيل الجديد، وأحدث تقدم وإنجازات جوجل في مجال الذكاء الاصطناعي، ودمج قدرات الذكاء الاصطناعي مع النظام البيئي بأكمله لشركة جوجل في خطابه الرئيسي.
* يعمل Gemini على تمكين النظام البيئي بأكمله لشركة Google
ليس هناك شك في أن جهاز Gemini سيكون الحدث الأبرز في مؤتمر Google I/O لهذا العام. لقد أدى إصدار Gemini 1.5، الذي تم تحديثه في فبراير/شباط من هذا العام فقط، إلى زيادة طول السياق إلى ملايين، ويمكن لأدائه بالفعل التنافس مع GPT-4. لذلك، فإن الخطوة التالية بالنسبة لجوجل هي النظر في مسألة التطبيق العملي - كيفية دمج جيميني مع أدوات البحث والصور والفيديو، وخرائط جوجل، وأدوات مساحة العمل مثل جيميل وجوجل دوكس.
بالإضافة إلى ذلك، قامت Google بحقن قدرات الذكاء الاصطناعي الخاصة بها تدريجيًا في Google Assistant. هل يمكن لقدرات Gemini القوية أن تخلق مساعدًا صوتيًا للغة الطبيعية أكثر تقدمًا وأكثر تشابهًا بالإنسان؟
ومن الجدير بالذكر أنه كشركات تمتلك نماذج كبيرة متقدمة وأعمال أجهزة، ما نوع الشرارات التي يمكن أن تخلقها شركتا Gemini وPixel من Google؟ في العام الماضي، كانت هناك تقارير تفيد بأن مساعد الذكاء الاصطناعي المسمى Pixie قد يظهر على Pixel 9.
يحتوي هاتف Pixel 8، الذي تم الكشف عنه في مؤتمر Google I/O العام الماضي، بالفعل على قدرات الذكاء الاصطناعي الخاصة بشركة Google. تم تجهيزه بمعالج Tensor G3 الذي طورته Google ذاتيًا، وله وظائف مثل ممحاة السحر الصوتي، وBest Take، والترجمة وقراءة صفحات الويب، وما إلى ذلك. على سبيل المثال، يمكن لميزة Best Take الجمع بين صور جماعية متعددة معًا واختيار تعبيرات أشخاص مختلفين من صور مختلفة لإنشاء صورة جماعية مثالية.
كما جرت العادة، سيتم إطلاق هاتف Pixel 9 في مؤتمر هذا العام، ولكن لم يظهر في التسريبات الحالية. بدلاً من ذلك، أصبح Pixel 8a أكثر شعبية. أما بالنسبة لما إذا كان المساعد الذكي Pixie سيظهر أم لا، فلا يمكننا سوى الانتظار لنرى.
وبالإضافة إلى ذلك، في أبريل/نيسان من هذا العام، كشفت وسائل الإعلام الأجنبية عن أن شركتي Apple وGoogle تعملان معًا لدمج Gemini في نظام iOS. ولم تؤكد أي من الشركتين الخبر رسميًا. إذا كانت الأخبار صحيحة، فيمكن اعتبارها بمثابة "تعاون قرن" بين عملاقين يتنافسان في العديد من الأعمال. أتساءل عما إذا كان بيتشاي سيعلن عن الأخبار ذات الصلة في مؤتمر Google I/O.
* أندرويد و AR/XR
باعتباره حجر الأساس لشركة Google، يعد نظام Android دائمًا جزءًا لا غنى عنه من مؤتمر Google I/O. تم الكشف عن نظام التشغيل Android 15 هذا العام، مع إصدار معاينات للمطورين وإصدارات تجريبية أولية بالفعل. ومن المقرر أن يقدم بيتشاي المزيد من التحديثات الرئيسية للنظام في خطابه. وبحسب المعلومات التي تم الكشف عنها سابقًا، فإنها ستقدم أيضًا نظام Wear OS للسيارات الذكية والساعات الذكية المبني على Android Auto.
وبالإضافة إلى ذلك، أفادت بعض وسائل الإعلام أن بيتشاي سيشارك أخبارًا حول برنامج الواقع المعزز من جوجل وسيقدم منصة Android XR التي طورتها لشركة سامسونج وغيرها من مصنعي شاشات الرأس. وبحسب التقارير التي صدرت في وقت سابق من هذا العام، فإن فريق أجهزة الواقع المعزز كان الأكثر تضرراً من جولة تسريح العمال التي شنتها جوجل، لذا تكهنت بعض وسائل الإعلام بأن الشركة تخلت عن تطوير أجهزة الواقع المعزز الخاصة بها وأنها ملتزمة تماماً بنموذج التعاون مع الشركات المصنعة للمعدات الأصلية. بمعنى آخر، سوف تركز جوجل على مستوى البرمجيات.
بالإضافة إلى الخطاب الرئيسي الذي ألقاه بيتشاي جي، يتضمن مؤتمر Google I/O لهذا العام أيضًا منتديات موضوعية متعددة، مثل أحدث التطورات في Google AI، والتطورات الجديدة في Android، وأطر عمل التعلم الآلي لعصر الذكاء الاصطناعي التوليدي، وما إلى ذلك. ومع ذلك، لن يتم توفير البث المباشر. سيتم إصدار المواد الفيديوية ذات الصلة بعد الخطاب. وستواصل HyperAI أيضًا الاهتمام بإعداد تقارير متعمقة حول الذكاء الاصطناعي. ترقبوا المزيد~
الكلمات الأخيرة
في الماضي، كانت الصناعة مقياسًا مهمًا لقوة البلد. واليوم دخلت القوة العلمية والتكنولوجية أيضًا إلى طاولة المفاوضات، بل وأصبحت ورقة مساومة في اللعبة بين القوى الكبرى. وبما أن شعبية عارضات الأزياء الكبيرة لا تزال مرتفعة، فإن كل خطوة تتخذها شركات وادي السيليكون العملاقة تجذب الكثير من الاهتمام. ما زلت أتذكر أنه في نهاية عام 2022، أصدرت OpenAI وMicrosoft وGoogle وما إلى ذلك فجأة تحديثات رئيسية، وصرخ مستخدمو الإنترنت - بعد الاستيقاظ، تغيرت دائرة الذكاء الاصطناعي مرة أخرى؟
مع دخولنا عام 2024، لا تزال المعركة تشتد، من السباق على المستوى التقني إلى تطوير سيناريوهات التطبيق، ومن القوى الكبرى القديمة إلى الشركات الناشئة الناشئة، يجب أن تكون الشركات التي يمكنها الاستمرار في الهيمنة على هذا الاتجاه هي تلك التي تتمتع بالخنادق. أما بالنسبة لكيفية قتال الرجال الكبار في أعلى الهرم، فلنحرك جميعًا مقاعدنا الصغيرة ونشاهد القتال بين الآلهة!
مراجع:
1.https://36kr.com/p/2660898993824512
2.https://techcrunch.com/2024/05/09/google-i-o-2024-what-to-expect/
3.https://www.spiceworks.com/tech/tech-general/articles/google-io-2024-expectations
4.https://www.theverge.com/2024/5/11/24154307/openai-multimodal-digital-assistant-chatgpt-phone-calls