HyperAI

المراجعة السنوية لعام 2022 | كرنفال الذكاء الاصطناعي الأكثر نضجًا والتكنولوجيا الأكثر إزعاجًا

特色图像

عام 2022 يقترب من نهايته وسط أصوات السعال. هذا العام، أصبحت AIGC الحصان الأسود الأكبر في مجال الذكاء الاصطناعي، ولدى ScienceAI تطبيقات عملية أكثر. لقد شهدنا هذا العام تخفيضات في الميزانيات وتسريح عمال من قبل كبرى الشركات المصنعة، كما شهدنا أيضًا كرنفالًا تكنولوجيًا للبقاء على قيد الحياة من المواقف اليائسة... هذه المقالة،دعونا نستعرض مع زملائنا الإنجازات البحثية والتطويرية الرائدة في مجال الذكاء الاصطناعي في عام 2022.

بيانات 2 في سي

إطار عام للتعلم الذاتي للكلام والرؤية والنص

وكالة النشر:ميتا ايه اي

وقت الإصدار:يناير 2022

عنوان المشروع:

https://github.com/facebookresearch/fairseq/tree/main/examples/data2vec

data2vec هونموذج موحد متعدد الوسائط للتعلم الذاتي الإشرافي،يمكنه معالجة الصور والنصوص والصوت والمهام الأخرى بأداء أعلى.

في 16 ديسمبر، تم إصدار data2vec 2.0، وهو أسرع بـ 16 مرة من خوارزميات الرؤية الحاسوبية ذاتية الإشراف الحالية بنفس الدقة.

مبادئ Data2vec 2.0

ألفا كود

توليد أكواد الذكاء الاصطناعي على مستوى المنافسة

وكالة النشر:ديب مايند

وقت الإصدار:فبراير 2022

عنوان المشروع:

https://github.com/deepmind/code_contests

يستخدم AlphaCode نموذجًا لغويًا كبيرًا لإنشاء الكود استنادًا إلى الوصف اللغوي للمشكلة.في تحدي Codeforces، هزم AlphaCode منافسي 46%. ولم يظهر البحث على غلاف مجلة ساينس فحسب، بل تم اختياره أيضًا كواحد من أفضل عشرة اكتشافات علمية لهذا العام حسب المجلة.

نظرة عامة على AlphaCode

دال إي 2

أداة تحويل النص إلى صورة

وكالة النشر:أوبن أيه آي

وقت الإصدار:أبريل 2022

عنوان المشروع: https://openai.com/dall-e-2/

بناءً على وصف النص، يمكنك إنشاء صور فنية بألوان أكثر واقعية.بالمقارنة مع Dall·E الذي أصدرته OpenAI في عام 2021، يمكن لـ Dall·E 2 إنشاء صور أكثر واقعية ودقة بدقة أعلى بأربع مرات.

رائد فضاء يمتطي حصانًا بأسلوب واقعي. مثال على صورة تم إنشاؤها بواسطة Dall·E 2

جاتو

وكيل ذكي متعدد الاستخدامات

وكالة النشر:ديب مايند

وقت الإصدار:مايو 2022

عنوان المشروع:

https://www.deepmind.com/blog/a-generalist-agent

جاتو هو عميل ذكي متعدد الاستخدامات.يمكنه تشغيل ألعاب Atari، ووصف الصور، والدردشة، وإخراج النص، وعزم الدوران المشترك، أو الرموز الأخرى بناءً على السياق.

يحل هذا النموذج العام جميع المهام المشابهة للذكاء الاصطناعي وقد يتجاوز في النهاية النماذج الخاصة بالمجال.

أضف تعليقًا للصورة، لا يزيد عن 140 حرفًا (اختياري)

طي ESM

نماذج التنبؤ ببنية البروتين

وكالة النشر:ميتا ايه اي

وقت الإصدار:يوليو 2022

عنوان المشروع:

https://github.com/facebookresearch/esm

ESM Fold هو نموذج للتنبؤ بتسلسلات البروتين.قادرة على إجراء تنبؤات هيكلية دقيقة للغاية ومباشرة على مستوى الذرة من البداية إلى النهاية. إنه يستخدم تسلسل إدخال واحد فقط ولا يحتاج إلا إلى النظر إلى تسلسل بروتين واحد، مما يسرع الاستدلال بشكل كبير.

التنبؤ ببنية التسلسل الفردي باستخدام ESM Fold

اصنع فيديو

نظام الذكاء الاصطناعي الذي ينتج مقاطع فيديو من النصوص

وكالة النشر:ميتا ايه اي

وقت الإصدار:سبتمبر 2022

عنوان المشروع: https://makeavideo.studio/

Make-A-Video هو نموذج لإنشاء نص إلى فيديو يتعلم الأوصاف الشائعة من الصور باستخدام أوصاف نصية، ويفهم أنماط الحركة ويتعلمها باستخدام مقاطع فيديو غير مصنفة.

تتميز مقاطع الفيديو التي تم إنشاؤها بواسطة Make-A-Video بأنماط متنوعة واستعادة نصية عالية، مما يجعلها نموذج SOTA لإنشاء مقاطع فيديو قصيرة.

بعض الأمثلة على إنشاء مقاطع فيديو استنادًا إلى أوصاف النصوص

ألفا تنسور

تحسين عملية ضرب المصفوفات وزيادة سرعة الحساب

وكالة النشر:ديب مايند

وقت الإصدار:أكتوبر 2022

عنوان المشروع:

https://github.com/deepmind/alphatensor

يقوم AlphaTensor بتحسين عملية ضرب المصفوفة 4*4 المثلى الحالية ويحسن بشكل أكبر سرعة الحساب لأكثر من 70 عملية ضرب مصفوفة أخرى بأحجام مختلفة. وقد نشرت هذه النتيجة على غلاف مجلة Nature.تم اختياره كواحد من أفضل عشرة اكتشافات علمية لهذا العام من قبل مجلة Scinece.

نظرة عامة على بنية AlphaTensor

ماجيك 3D

أدوات إنشاء محتوى من النص إلى ثلاثي الأبعاد

وكالة النشر:إنفيديا

وقت الإصدار:نوفمبر 2022

عنوان المشروع:

https://deepimagination.cc/Magic3D/

انضمت NVIDIA إلى AIGC،من الممكن إنشاء نماذج شبكية ثلاثية الأبعاد استنادًا إلى أوصاف النص.يجمع بين تقنية معالجة الصور وطرق التحرير الفوري المستندة إلى النص لتوفير طريقة جديدة للتحكم في التوليف ثلاثي الأبعاد، مما يجعل من الممكن إنشاء نماذج شبكية ثلاثية الأبعاد عالية الجودة.

يقوم Magic 3D بإنشاء محتوى نصي ثلاثي الأبعاد على مرحلتين.

تشات جي بي تي

نموذج المحادثة الفائق

وكالة النشر:أوبن أيه آي

وقت الإصدار:نوفمبر 2022

عنوان المشروع:

https://openai.com/blog/chatgpt/

يتم تدريب ChatGPT باستخدام RLHF (التعلم التعزيزي من ردود الفعل البشرية)، وهي نفس الطريقة التي يستخدمها InstructGPT، مع وجود اختلافات طفيفة فقط في إعداد جمع البيانات.

يمكن لـ ChatGPT الدردشة والتواصل مثل الإنسان وإكمال المهام مثل كتابة رسائل البريد الإلكتروني ونصوص الفيديو وكتابة النصوص والترجمة والترميز. منذ إطلاقه، اجتذب عددًا لا يحصى من المطورين في الداخل والخارج لتجربته ومناقشته بشدة، ويمكن القول إنه المشروع التكنولوجي الذي يتمتع بأعلى مشاركة من المطورين في عام 2022.

نظرة عامة على عملية تدريب ChatGPT

النقطة هـ

إنشاء سحابة نقاط ثلاثية الأبعاد استنادًا إلى وصف النص

وكالة النشر:أوبن أيه آي

وقت الإصدار:ديسمبر 2022

عنوان المشروع:

https://github.com/openai/point-e

تنقسم عملية إنشاء سحابة نقاط ثلاثية الأبعاد استنادًا إلى مطالبات النص باستخدام Point·E إلى ثلاث خطوات::

1. إنشاء عرض تركيبي استنادًا إلى مطالبة النص

2. إنشاء سحابة نقاط خشنة (1024 نقطة) بناءً على العرض الاصطناعي

3. إنشاء سحابة نقاط دقيقة (4096 نقطة) استنادًا إلى سحابة نقاط منخفضة الدقة وعرض اصطناعي

باستخدام بطاقة Point·E واحدة، يمكن إنشاء سحابة نقاط ثلاثية الأبعاد في دقيقة واحدة، ويقول تحويل النص إلى ثلاثي الأبعاد وداعًا لعصر استهلاك طاقة الحوسبة العالية.

أضف تعليقًا للصورة، لا يزيد عن 140 حرفًا (اختياري)

لقد مضى الشتاء وجاء الربيع، فلنتخيل عام 2023

إن عام 2022 يقترب من نهايته، ومن المتوقع أن يكون عام 2023 مليئًا بالمجهول. ما هي الإنجازات الجديدة التي سيتم تحقيقها في مجال AIGC؟ كيف سيستجيب ScienceAI للتحديات الناجمة عن تقاطع العلوم الأساسية والذكاء الاصطناعي؟ ما هي الإنجازات الجديدة التي ستأتي من أبحاث وتطوير الرقائق وأنظمة التشغيل المحلية؟

ما هي توقعاتكم لتقنيات وتطبيقات الذكاء الاصطناعي في عام 2023؟ مرحبا بكم في ترك رسالة للمناقشة~

كما نشرت مجلة Chao Neuro العديد من المقالات التي تقدم مقدمة عن تطور الذكاء الاصطناعي في العام الماضي. انقر للقراءة~