[المنتدى الفرعي لمؤتمر أوسكار لصناعة المصدر المفتوح] إلى أين يتجه نموذج المصدر المفتوح الكبير؟

في غضون شهرين، سيحتفل ChatGPT بالذكرى السنوية الأولى لتأسيسه. باعتباره نموذج الذكاء الاصطناعي الأول من نوعه، فإن ChatGPT يشبه حقنة منبهة تخترق الجهاز العصبي المركزي لآلاف الصناعات، مما يؤدي إلى إطلاق سباق تسلح غير مسبوق للذكاء الاصطناعي في جميع أنحاء العالم.
في العام الماضي، شهدنا تطور GPT-3.5 إلى GPT-4 متعدد الوسائط، كما تحرك Google PaLM، الذي يدعي أنه يحتوي على 562 مليار معلمة، نحو PaLM 2، الذي يحتوي على مقياس معلمات أصغر وأكثر كفاءة. لقد رأينا شركة Meta تقوم بفتح مصدر نموذج Llama الكبير الخاص بها، كما أنتجت عددًا من النماذج الأقل تكلفة والأصغر حجمًا بما في ذلك Alpaca وVicuna وKoala وFalcon. عائلة الألبكة…
في غضون بضعة أشهر فقط، ازدهر مجتمع النماذج الكبيرة مفتوحة المصدر، وهو يُظهر علامات التنافس مع النماذج المغلقة المصدر، مما صدم جوجل وتسبب في قلقها من أنها "لا تمتلك خندقًا".في شهر يوليو، أصدرت Meta النسخة مفتوحة المصدر Llama 2، والتي تضاهي GPT-3.5 في الأداء ويمكن استخدامها لأغراض تجارية مجانية. لقد أدى هذا إلى تقويض المشهد النموذجي الكبير بشكل مباشر.لقد أدى ذلك إلى قتل بعض النماذج الكبيرة ذات المصدر المغلق والتي لم يكن مستواها المتطور ذاتيًا جيدًا مثل Llama 2.
ونتيجة لذلك، صرخ كثير من الناس بأن "الوقت قادم عندما يكون لدى الجميع نموذج كبير من أندرويد". ولكن ينبغي لنا أن نرى ذلك أيضًاوفي ظل الصورة المشرقة للنموذج الكبير مفتوح المصدر، هناك أيضًا سلسلة من التحديات مثل الموهبة والتنظيم والبيانات والقيود التجارية؛عند النظر إلى الخارج، هناك نماذج كبيرة مفتوحة المصدر قوية مثل Llama 2. متى ستتمكن النماذج الكبيرة مفتوحة المصدر المحلية من مواكبة هذه النماذج؟ إلى أين سيقود النقاش بين المصدر المفتوح والمصدر المغلق النموذج الكبير في النهاية؟
المؤلف | برج
المحرر | سانيانغ
في 21 سبتمبر، نظمت أكاديمية الصين لتكنولوجيا المعلومات والاتصالات وجمعية معايير الاتصالات الصينية بشكل مشترك مؤتمر أوسكار لصناعة المصادر المفتوحة 2023في منتدى "نموذج المصدر المفتوح الكبير" الذي عقد في بكين، والذي استضافته شركة Segmentfault وHyperAl بشكل مشترك،انخرط خبراء من مجتمعات البحث العلمي والصناعة والاستثمار في تبادلات ومناقشات شاملة ومتعددة الجوانب حول "الفرص والتحديات التي يفرضها تطوير نماذج كبيرة مفتوحة المصدر".
الضيوف الثلاثة في هذه المائدة المستديرة هم:وانغ وي، أستاذ في كلية علوم البيانات والهندسة بجامعة شرق الصين العادية ومدير جمعية المصدر المفتوح؛ شا جيان، الخبير الفني الأول في مجموعة Ant؛ شو كاي يونج، نائب المدير العام لمؤسسة استثمارية معروفة؛ والمضيف هو وانج تشين هان، المؤسس والرئيس التنفيذي لشركة OpenBayes Bayesian Computing.

من اليسار إلى اليمين:
المُنسّق: المؤسس والرئيس التنفيذي لشركة OpenBayes Bayesian Computing وانغ تشينهان
أستاذ في كلية علوم البيانات والهندسة، جامعة شرق الصين العادية، مدير جمعية المصدر المفتوح وانغ وي
خبير فني أول في مجموعة Ant سيف الرمل
نائب المدير العام لمؤسسة استثمارية معروفة شو كايونغ
اضغط على الرابط أدناه للانتقال مباشرة إلى المنتدى ☟
وبدون الإخلال بالقصد الأصلي، قمنا بتلخيص أهم ما ورد في هذه المحادثة، وأدرجناها أدناه. والآن، يرجى الانضمام إلينا في الاستماع إلى الأفكار الرائعة التي يقدمها الخبراء.
مناقشة أحدث التطورات في النماذج الكبيرة مفتوحة المصدر

منذ إطلاق ChatGPT في العام الماضي حتى الآن، شهدنا إصدار GPT-4 دوليًا، ومتابعة Claude Anthropic، والتحديث السريع لعائلة Llama في مجتمع المصدر المفتوح. وقد ظهرت في الصين عدد من شركات النماذج المحلية، كما يتنافس مجتمع المصدر المفتوح أيضًا على الجمال. كل هذا يشير إلى أن تطوير النماذج الكبيرة سريع للغاية. المعلمون الثلاثة الحاضرون هنا هم من دوائر البحث العلمي والصناعة والاستثمار على التوالي. نود أن نطلب من الجميع تقييم الوضع الحالي واتجاهات التطوير المستقبلية في مجال النماذج الكبيرة من وجهات نظر مختلفة. س1: ما مدى اتساع الفجوة بين مجتمع المصدر المفتوح بشكل عام وGPT-4؟ هل هناك نقطة تحول حيث يصبح مجموع إنجازات مجتمع المصدر المفتوح أعلى من المستوى الأكثر تقدمًا لأي شركة تجارية؟
وانغ وي:غالبًا ما يستخدم الأشخاص المصدر المفتوح والمصدر المغلق كنهجين متعارضين.ولكنني شخصيا أعتقد أن هذين النهجين يمثلان في الواقع استراتيجيات عمل مختلفة.حتى شركات المصدر المفتوح تحتاج إلى استثمار موارد ضخمة. يمكن للشركات المتأخرة اللحاق بالشركات الرائدة من خلال المصدر المفتوح، كما يمكن للشركات الرائدة أيضًا اكتساب وجهات نظر متعددة الأوجه من خلال المصدر المفتوح.
ومن منظور التنمية طويلة الأمد، فإن التسويق التجاري مهم للغاية. وبعيدًا عن التسويق التجاري، يوفر المصدر المفتوح مزايا هائلة إذا أردنا توسيع النظام البيئي أو مجتمع المطورين على المدى القصير. منذ أن أصبح Llama 2 مفتوح المصدر في عام 2023، لم يجذب عددًا كبيرًا من المطورين فحسب، بل جذب أيضًا العديد من المحترفين في سلاسل الأدوات والصناعات والتقييمات، مما وضع بعض الضغط على OpenAI.
أكبر فائدة للمصدر المفتوح هو أنه يسمح للجميع برؤية ما يريد القيام به وكيف ينوي القيام به.ومن وجهة نظر المدارس، يوفر المصدر المفتوح قناة بحث ملائمة لعلماء الجامعات، وبالتالي توليد نتائج بحثية قيمة، وهو ما يعزز بدوره تطوير تكنولوجيا المصدر المفتوح.لذا، لطالما اعتقدت أن المصدر المفتوح هو استراتيجية تجارية جيدة.
سيف الرمل:ومن منظور الصناعة، تطورت النماذج الكبيرة بسرعة خلال العامين الماضيين. إذا لم تكن هناك موجة أو اختراق تكنولوجي كبير،في الواقع، كان هيكل النموذج نفسه يميل إلى التطبيع.
بالنسبة للشركات التجارية، من ناحية أخرى، تساعد نماذج المصدر المفتوح على زيادة نفوذها وتسريع التكرار التكنولوجي؛ من ناحية أخرى، من منظور تأثيرات النموذج، يرتبط النموذج بشكل أكبر ببيانات التدريب وطرق التدريب، وقد تتمتع الشركات ذات المصدر المغلق بالعديد من الميزات الفريدة في هذه الجوانب.
ولكن بالنظر إلى التاريخ الطويل،نحن نؤمن دائمًا أن أي إغلاق تكنولوجي لن يعيق تقدم التاريخ.في نهاية المطاف لن تكون هناك حاجة لإخفاء تكنولوجيا الشركات ذات المصدر المغلق.
شو كايونغ:ومن وجهة نظر مجتمع الاستثمار،من المؤكد أن المصادر المفتوحة سوف تلحق بالمصادر المغلقة، ولكن من الصعب تقدير الوقت المحدد لذلك.ولكنني شخصيا أعتقد أن البرمجيات مفتوحة المصدر قد تلحق بالبرمجيات المغلقة المصدر خلال العامين أو الثلاثة أعوام القادمة، لأن البرمجيات مفتوحة المصدر لا تتمتع بميزة السبق في شيء من حيث النموذج نفسه.
تنقسم مزايا المبادرة بشكل عام إلى فئتين:على سبيل المثال، عندما يتقدم تصنيع الرقائق من 7 نانومتر إلى 3 نانومتر، يحتاج المتأخرون أيضًا إلى اتباع مسار ثابت للتطور؛ لكن النموذج الكبير نفسه لا يتبع هذا المسار. يتضمن النموذج الكبير جانبين مهمين:الأول هو البيانات، والثاني هو أساليب التدريب.
على الرغم من أن أساليب التدريب موجودة حاليًا في أيدي شركات متقدمة مغلقة المصدر مثل OpenAI، بمجرد أن يجد المجتمع حلاً أفضل، أو يغادر موظفو شركات مغلقة المصدر وينضمون إلى مجتمع مفتوح المصدر، فإن أساليب مفتوحة المصدر ستكتسب قوة بسرعة. ولذلك فإن النموذج الكبير في حد ذاته لا يواجه الكثير من الحواجز التي تعوق التحرك الأوائل. هذه هي النقطة الأولى.
النقطة الثانية هي تأثير الشبكة.على سبيل المثال، تحتوي تطبيقات الشراء الجماعي على العديد من التجار والمستخدمين، لذا فهي تتمتع بتأثير الشبكة. ومع ذلك، فإن النموذج الكبير في حد ذاته لا يتمتع بمثل هذه الخصائص، وبالتالي فإن الشركات ذات النموذج الكبير المغلق المصدر لا تتمتع بميزة الحاجز المتمثلة في تأثيرات الشبكة.
لذلك، أعتقد أن المصدر المفتوح سوف يتفوق بالتأكيد على المصدر المغلق، ولكن التوقيت سوف يعتمد على الوضع الحالي والتقدم.
ومن الواضح أن مجال النماذج الكبيرة مفتوحة المصدر في الصين أظهر اتجاهين للتنمية. الأول هو اتباع خطى النماذج الكبرى المتقدمة دوليا. على سبيل المثال، يقوم بعض الأشخاص بتنفيذ أعمال توطين اللاما. والفرق الأخرى تقود مثل Baichuan Intelligence لإصدار نماذجها الصينية الكبيرة الخاصة. بشكل عام، يشهد تطوير النماذج الكبيرة في المجال الصيني ازدهارًا كبيرًا، ولكن من منظور تقييم البيانات، لا تزال هناك فجوة معينة بين نشاط المجتمع الصيني والمجتمع الدولي. س2: في نظر الخبراء، ما هو التقدم الحالي للمصدر المفتوح في مجال النماذج الصينية الكبيرة؟ هل هو اللحاق بالمصدر المغلق أو تقديم مساهمات أصلية؟ ما هي النسب المقابلة؟ ما هو جو المصدر المفتوح في الصين في مجال النماذج الكبيرة؟
وانغ وي:نحن في كثير من الأحيان نقوم دون وعي بمقارنة بيئة وأجواء المصادر المفتوحة في الصين مع تلك الموجودة في الغرب.في الواقع، يعتبر المصدر المفتوح بحد ذاته ظاهرة عالمية.وهذا يعني أنه يمكن الوصول إليه ونشره وتعديله في أي مكان في العالم.
نشأت البرمجيات مفتوحة المصدر في أوروبا والولايات المتحدة، وقد مرت عقود من الزمن منذ إنشاء مؤسسات Linux وApache. وعلى النقيض من ذلك، فإن مؤتمرات المصادر المفتوحة الكبيرة مثل OSCAR بدأت للتو في الظهور في الصين، ولكن على الرغم من ذلك فقد حققنا تقدماً كبيراً، كما يمكن رؤيته من الإنجازات المختلفة التي يتم إصدارها في مواقع الفروع كل عام. علاوة على ذلك، يتزايد اهتمام البلاد بالمصادر المفتوحة أيضًا يومًا بعد يوم، وفي الوقت الحالي يساهم عدد متزايد من الأشخاص في الصين في المصادر المفتوحة العالمية.
بالإضافة إلى،إن النموذج الصيني هو ابتكار فريد للغاية بالنسبة للعالم.لأن اللغة الصينية لغة فريدة وغنية للغاية ويتحدثها مجموعة واسعة من المتحدثين. إن خلقنا للنموذج الصيني ليس مواجهة أو منافسة، بل هو انعكاس للتنوع الثقافي. هناك أيضًا العديد من التقييمات والتطبيقات متعددة اللغات على المستوى الدولي، ولدينا أيضًا دورات ومشاريع مثل اللغة الصينية الدولية، والتي لها قيمة تطبيقية واسعة في ظل النموذج الكبير.
إذا أردنا تقييم المدى المحدد للنموذج الصيني الكبير، فأنا شخصيا أعتقد أننا يجب أن ننظر إلى نتائج التطبيق النهائية. السبب وراء شعبية هذه الجولة من AIGC التي تم تشغيلها بواسطة ChatGPT هو أنها تتمتع بمزايا كبيرة في إنشاء النصوص والرسومات. وإذا أمكن تنفيذ النموذج الصيني الكبير في سيناريوهات تطبيقية أفضل مثل التعليم والتبادلات الدولية، فإن تأثيره وتقدمه سوف ينعكسان بشكل طبيعي.
سيف الرمل:أولاً وقبل كل شيء، فيما يتعلق بالتقييم، كانت هناك تقييمات متعددة اللغات في ChatGPT-4 المبكرة. في الواقع، قد يكون الأمر متعدد اللغات، ولكنه قد يعمل بشكل أفضل في اللغات السائدة وقد يكون أسوأ في اللغات غير الشائعة.
وفي هذه المرحلة، تكمن ضرورة قيام العديد من المؤسسات الصينية بتطوير النماذج الصينية في:ومن وجهة نظر الدولة والمؤسسة، يأمل الجميع في إتقان التقنيات الأساسية.حتى بالمقارنة مع الاتصال المباشر بخدمات الآخرين، فإن التكلفة الأعلى لا تعني بالضرورة الحصول على نتائج أفضل في الوقت الحالي.
ثانياً، من منظور المجتمع، فإن أجواء المجتمع الصيني بأكمله، بما في ذلك مجتمع المصدر المفتوح، ليست جيدة بالفعل مثل أجواء الغرب. لكن في الواقع، تقوم العديد من المؤسسات الغربية، بما في ذلك مؤسسة أباتشي ومؤسسة لينكس، الآن بإنشاء فروع لها في الصين. ومن المتوقع أن تعمل هذه المؤسسات الأجنبية المعروفة والفروع الصينية على قيادة المجتمع الصيني. ونحن نأمل في الواقع أن نرى المؤسسات المحلية المؤثرة تعمل على تطوير مجتمعاتها الخاصة.
شو كايونغ:أعتقد أن هناك فجوة لا تزال قائمة بين النموذج الصيني الكبير والنماذج الأجنبية الكبيرة. تدعم النماذج الأجنبية الكبيرة لغات متعددة، في حين أن التطوير المحلي أبطأ. علاوة على ذلك، يستخدم عدد قليل من الطلاب في الصين نموذج اللغة الصينية الكبيرة للقيام بالواجبات المنزلية أو كتابة المقالات أو حل المسائل الرياضية، ولكن هذه الظاهرة شائعة جدًا في الخارج.
ويرجع هذا جزئيًا إلى أن النماذج الكبيرة المحلية ترتكب أخطاءً في بعض الأحيان، ويميل المستخدمون إلى إزعاجها أكثر.لذا أعتقد أن النماذج الصينية الكبيرة لا يزال أمامها طريق طويل، لكن اللغة الصينية لها خصائصها اللغوية الخاصة، ولا تزال هناك العديد من الفرص لبقاء النماذج المحلية الكبيرة وتطويرها.
والآن، بالإضافة إلى النموذج الكبير نفسه، بدأ الناس يهتمون أكثر فأكثر بمشاريع أخرى في نظام بناء النموذج الكبير بأكمله، بما في ذلك مجموعات البيانات، وطرق التدريب، وقواعد الرقائق، والبرمجيات المرتبطة بمجموعة الرقائق، والأنظمة البيئية للبرمجيات المرتبطة بالاستدلال. س3: المعلمون، هل تهتمون بمكونات الأدوات الأخرى أو الشركات التجارية في مجال النماذج الكبيرة مفتوحة المصدر؟
وانغ وي:بالإضافة إلى علم البيئة،كما أركز أيضًا على القضايا القانونية والتنظيمية والامتثالية.
من وجهة نظر المدرسة، فإن التأثير الاجتماعي للشركة أكثر أهمية من تطورها. وخاصة بالنسبة للنماذج الكبيرة، فإننا غالبًا ما نتحدث عن قضايا مثل الحوكمة والامتثال والأخلاق. لم تعد النماذج الكبيرة مجرد تكنولوجيا بسيطة تنتمي حصريًا إلى صناعة واحدة. يمكن لأي شخص استخدامه لإنشاء النصوص والصور. ومع ذلك، مع تأثيرها الهائل، هناك أيضًا مشكلات أمنية محتملة.
سيتم ربط هذه الأسئلة بالبيانات والأدوات التقنية.على سبيل المثال، تتطلب جودة البيانات والخصوصية والأمان لنموذج التدريب الخاص بك ليس فقط جهود المهندسين، بل أيضًا الدعم القوي من المحترفين مثل المحامين.دعونا نبني هذا الأساس معًا. وعلى هذا الأساس، سنركز على طبقة الشريحة والبرمجيات والمحتويات الأخرى المذكورة أعلاه.
على المستوى الفني، أنا أكثر اهتماما بسلسلة الأدوات الأساسية.وقد لا تكون لهذه السلاسل من الأدوات قيمة تجارية مباشرة مثل الشركات التجارية، وستتاح للجامعات المزيد من الفرص للقيام بهذه الأشياء. في الوقت الحاضر، تقوم العديد من الجامعات، مثل جامعة فودان، ببناء بعض البرامج الأساسية، وهو ما تفتقر إليه بلادنا حاليًا. على الرغم من أن سلاسل الأدوات هذه في حد ذاتها لا تتمتع بقيمة تجارية كبيرة، إلا أنها تشكل أشياء أساسية ومحورية. ولذلك، فمن وجهة نظر المدرسة، فإننا نولي اهتماما أكبر لهذه القضايا المتعلقة بالامتثال الأخلاقي والتي ذكرناها سابقا.
سيف الرمل:سأتحدث عن بيئتها وتأثيرها على المنبع والمصب للنماذج الكبيرة من منظور البرمجيات والأجهزة.
هناك تفسيرات عديدة للنموذج الكبير. في نظر مطوري الخوارزميات، النموذج الكبير هو نموذج خوارزمي يحل المهام العامة. من وجهة نظر هندسية، النموذج الكبير هو مجرد نموذج كبير. تحدد قوة الحوسبة والبيانات وعدد المعلمات الحد الأعلى لقدرات النموذج.لكن الآن بدأت العديد من الدراسات في التركيز على تخفيف وزن النماذج الكبيرة، ليس لأن العديد من المعلمات ليست ضرورية، ولكن لأن طبقات البرامج والأجهزة لا تستطيع مواكبة ذلك.
إن الدورة التاريخية الكاملة للبرمجيات والأجهزة والخوارزميات هي في الواقع عملية تطوير حلزونية يعزز بعضها بعضا، ولكن الآن ألقى النموذج الكبير بالكرة خارجًا، وأصبحت تكاليف برمجياته، وخاصة الأجهزة، مرتفعة للغاية.
إن المشكلة الأكبر التي تؤثر حالياً على تسويق النماذج الكبيرة هي تكلفة الاستدلال.على الرغم من أن تكلفة التدريب هي الجانب الأول، إلا أنها ممكنة حتى لو كان التدريب أبطأ. بعد كل شيء، هذه العملية غير متصلة بالإنترنت، ويمكن إنتاج نموذج يحتوي على مئات المليارات من البايتات بعد شهر واحد من التدريب. ولكن السبب مختلف. على سبيل المثال، إذا تم تحقيق معدل سرعة الضوء بمعدل مرة واحدة كل بضع ثوان أو مرة واحدة كل دقيقة، وإذا تم توفيره مجانا لمليارات الأشخاص في جميع أنحاء البلاد، فإن التكلفة ستكون مرتفعة للغاية. إذا تم فرض رسوم على ذلك، فقد يتم فقدان المستخدمين، وهذه هي المشكلة الأكبر.
وفي الوقت الحالي، تعمل كافة الأطراف في جميع أنحاء البلاد بجهد كبير للتعامل مع هذه القضايا.من مستوى الأجهزة،وبسبب القمع الذي تمارسه الولايات المتحدة، فإن البطاقات التي نشتريها هي في الأساس نسخ مخصية، كما تستكشف الشركات الكبرى أيضًا تطبيق البطاقات المحلية. بقدر ما أستطيع أن أرى، فإن المؤشرات المختلفة لقوة الحوسبة للبطاقات المنتجة محليًا كلها جيدة.
برمجة:لا تزال مجموعة البرامج التي تعتمد على نظام GPU من NVIDIA والتي تم إنشاؤها على CUDA تتمتع بخندق قوي، والذي يغطي من إطار التدريب على المستوى الأعلى إلى مكتبة المشغل الأساسية، كما أنها تشكل جبلًا ضخمًا يتعين على مصنعي الأجهزة المحليين تسلقه. تعمل جميع شركات الأجهزة الكبرى على تطوير مجموعات البرامج الخاصة بها واعتماد استراتيجيات مختلفة.
ولكن من وجهة نظر المستخدمين والمطورين،لا أزال آمل أن يتمكنوا من تكييف نظامهم البيئي الخاص بشكل أكبر على مستوى المترجم، والاندماج مع إطار العمل مفتوح المصدر السائد على مستوى المستخدم، بحيث يمكن للمستخدمين فقط إدراك تحسن الأداء.في الوقت الحاضر، يبدو أن هذا الاتجاه هو السائد، ولكن الشركات الكبرى بالتأكيد لا تستطيع التوصل إلى إجماع كامل بسبب استراتيجياتها التجارية الخاصة.
لذا، على مستوى البرمجيات والأجهزة، نحتاج إلى بعض الوقت والتقدم التكنولوجي لمواكبة الطلب الحالي. وهذا يشكل تحديًا، ولكنه أيضًا فرصة عظيمة.
شو كايونغ:يولي مجتمع الاستثمار اهتمامًا وثيقًا بالمرحلة العليا والمرحلة النهائية من النموذج والصناعات المرتبطة به.
على سبيل المثالالطبقة السفلية للنموذجسننظر في بعض الفرص في طبقة البنية التحتية مثل الشبكات ثلاثية الأبعاد وأنظمة إدارة قواعد البيانات العلائقية؛ وطبقة التطبيقسنركز على الفرص المتاحة في بعض الصناعات الرأسية، مثل القراءة الآلية للتقارير والإعلانات المالية، أو التلخيص الآلي في الصناعة المالية، واكتشاف الأخطاء في القطاع الصناعي، والمؤسسات ذات قواعد البيانات الحصرية، والشركات الناشئة التي تقدم نماذج كبيرة خاصة أو نماذج صغيرة مستمدة من نماذج كبيرة لحل مشكلة واحدة فقط أو سلسلة من المشاكل.
بالإضافة إلى التطورات السابقة واللاحقة للنماذج الكبيرة، سوف ينظر المستثمرون أيضًا إلى بعض الاحتمالات الجديدة للنماذج الكبيرة أو الذكاء الاصطناعي.على سبيل المثال، كنت أيضًا أبحث في المجالات ذات الصلة بالحوسبة الكمومية والمصادر المفتوحة مؤخرًا، لأن الذكاء الاصطناعي التقليدي يتضمن نماذج كبيرة، ينمو أداؤها بشكل خطي مع التكلفة، لكن الحوسبة الكمومية تنمو بشكل كبير.
على مدى السنوات العشر إلى الاثنتي عشرة الماضية، كان هناك عدد لا بأس به من الشركات المدرجة في بورصة ناسداك في الولايات المتحدة والتي ولدت على أساس تكنولوجيا المصدر المفتوح (أو على أساس الشركات الأم المدرجة)، مثل Apache وMongo DB وما إلى ذلك. ويمكن ملاحظة أن هذه الشركات التي استثمرت في المصدر المفتوح حققت قيمة تجارية وعوائد جيدة. ولكن بالنظر إلى الصين، هناك عدد قليل من الشركات الصينية التي تستثمر في النظام البيئي مفتوح المصدر، وعدد أقل من الشركات التي ذهبت إلى مرحلة الإدراج أو تولي زمام المبادرة. س4: أيها المعلمون، هل نجح نموذج الأعمال الخاص بالنظام البيئي مفتوح المصدر في الصين حقًا؟ هل هناك حالة عمل ناجحة؟ إذا كان الأمر كذلك، فهل تعمل النماذج الكبيرة على تعزيز هذا الاتجاه؟ إذا لم يكن الأمر كذلك، فهل هناك فرصة أن تصبح النماذج الأكبر حجماً جزءاً من هذا الاتجاه؟
شو كايونغ:لا توجد في الأساس شركات مفتوحة المصدر مدرجة في الصين، ولكن هناك العديد من الشركات مفتوحة المصدر المدرجة في الخارج.أعتقد أن الفارق الرئيسي بين نتائج قوائم المصادر المفتوحة في الصين والولايات المتحدة يكمن في عامل الموهبة.تتمتع الولايات المتحدة بجاذبية المواهب العالمية وتتمتع بعقلية منفتحة ورؤى فريدة. معظم أصحاب المشاريع مفتوحة المصدر يأتون من وادي السيليكون.
هناك أيضًا العديد من المطورين/قادة الرأي في الصين الذين يشاركون في المصدر المفتوح. على الرغم من عدم وجود شركة مفتوحة المصدر مدرجة حتى الآن، إلا أنني أعتقد أن ذلك ممكن في المستقبل، وخاصة في مجال النماذج الكبيرة.
في الوقت الحاضر، إذا نظرنا إلى مختلف أنحاء العالم، فإن الصين والولايات المتحدة فقط هما القادرتان على صنع نماذج كبيرة الحجم. إن المنافسة التي نواجهها في الصين أكثر مباشرة، ولكن على مر السنين قمنا أيضًا بتدريب عدد كبير من المواهب في مجال الكمبيوتر، وهناك المزيد والمزيد من المشاركين في مجال المصدر المفتوح.ولذلك، لا تزال هناك فرصة لإنشاء شركة عامة في مجال المصدر المفتوح.
سيف الرمل:لا يبدو أن هناك أي مشاريع مفتوحة المصدر ناجحة جدًا مدرجة في الصين، ولكن هناك بالتأكيد مشاريع مفتوحة المصدر وشركات ناشئة معروفة.
إن الجو في وادي السيليكون أفضل بالفعل. وبعد كل شيء، فقد كان يتطور لسنوات عديدة. بالإضافة إلى ذلك، تتمتع مؤسسات المصدر المفتوح ومؤسسات الاستثمار الأجنبية بآلية جيدة للحضانة والتوجيه للمشاريع مفتوحة المصدر المحتملة، بما في ذلك التعاون المجتمعي والزراعة التجارية. قد لا تكون العديد من المشاريع الممتازة قد نمت بشكل جامح. ولا نزال في حاجة إلى عملية اللحاق بالركب، ويتعين على البلاد أن تواصل الاستثمار في هذه المجالات، بما في ذلك التعليم.
في هذه الصناعة المزدهرة في الصين،إذا أرادت شركة أن تطرح أسهمها للاكتتاب العام، فيجب عليها أولاً أن تمتلك تراكماً عميقاً نسبياً من التكنولوجيا، وثانياً، تحتاج إلى نموذج أعمال قادر على الصمود أمام اختبار الزمن.لقد وجدت أن العديد من المشاريع مفتوحة المصدر الممتازة لم تكتشف كيفية جني الأموال من منتجاتها، ولكن هذا هو الشيء الأكثر أهمية في الواقع.
وانغ وي:وأود أن أذكر ثلاث نقاط. الأول هو النجاح التجاري.لقد كنت أعتقد دائمًا أن النجاح التجاري لا علاقة له بالضرورة بوجود مصدر مفتوح أم لا.على المستوى التجاري، يعتمد الأمر أكثر على ما إذا كان السوق يحتاج إليك وما إذا كنت تلبي احتياجات العملاء، في حين أصبح المصدر المفتوح الآن مجرد وسيلة دعائية.
النقطة الثانية هي ما معنى المصدر المفتوح للنماذج الكبيرة؟يختلف نموذج المصدر المفتوح عن كود البرنامج مفتوح المصدر.بعد أن أصبح النموذج مفتوح المصدر، فإنه يشكل تجربة جديدة بالنسبة لنا أن نرى ما يمكن للمطورين والمستخدمين القيام به بناءً عليه. على الرغم من أن النموذج مفتوح المصدر هو وسيلة لتنزيل النماذج واستخدامها، إلا أنه يجلب أيضًا بعض المشكلات الجديدة ويصعب تطبيق التعريف أو الإطار التقليدي للمصدر المفتوح. ومن ثم، فإن كيفية بناء مجتمع ونظام بيئي يعتمد على هذا النموذج هي قضية جديدة تماما.
ما أهتم به شخصيًا هو تنمية المواهب، وأعتقد أن المصدر المفتوح يساعد كثيرًا في تنمية المواهب.
أولاً، يسمح لطلاب الجامعات بالوصول إلى أحدث التقنيات بسرعة أكبر.بعد صدور Llama، قامت العديد من الجامعات على الفور بنشر بعض البرامج وتعديلها وإضافة محتوى مرتبط بمجالاتها الخاصة، وقد استفادت جميعها من المصدر المفتوح.
ثانياً، يعد نموذج التعاون مفتوح المصدر أكثر فائدة لتدريب الطلاب من التدريب التقني المحض.إنه يحسن بشكل كبير مهارات التواصل لدى الطلاب ويعلمنا كيفية بناء علاقات تنافسية وتعاونية مع الشركاء، وهو بالضبط ما يفتقر إليه الطلاب الصينيون. تفتقر الصين إلى مشاريع مفتوحة المصدر ناضجة مثل تلك الموجودة في الخارج. من ناحية، يرجع ذلك إلى مشاكل اللغة، ومن ناحية أخرى قد يكون مرتبطًا بعادات الشعب الصيني - فنحن لسنا جيدين جدًا في التعبير عن آرائنا في الأماكن العامة، ولكن في المجتمع نحتاج إلى التعبير عن آرائنا بناءً على بعض الحقائق. لذلك، فإن المصدر المفتوح مفيد جدًا في تدريب قدرات الطلاب في هذا المجال.
أشجع الطلاب بشدة على المشاركة في المشاريع والمجتمعات مفتوحة المصدر، وخاصة مشاريع المصدر المفتوح في الصين. كما آمل أن تتمكن المزيد من الشركات من توفير المزيد من الفرص للطلاب الذين يساهمون بشكل فعال في المجتمع.
نموذج مفتوح المصدر كبير من منظور البحث العلمي والصناعة والاستثمار
تتمتع النماذج الكبيرة الحالية بالقدرة على إنشاء التعليمات البرمجية ويمكنها حتى تقديم اقتراحات للهندسة المعمارية. يقول الناس أن الذكاء الاصطناعي سيحل محل العديد من الوظائف في المستقبل، وخاصة في مجال الكمبيوتر. قد يخضع نموذج العمل لبعض التغييرات بسبب ظهور نماذج كبيرة. س1: البروفيسور وانغ وي، بصفتك رائدًا في مجال المصادر المفتوحة وقائدًا أكاديميًا في جامعة شرق الصين العادية، ما رأيك في التغييرات التي أحدثتها الذكاء الاصطناعي في عملية تنمية المواهب في مجال الكمبيوتر؟ في مواجهة الاتجاه المتزايد للنماذج الكبيرة في المستقبل، ما هي المهارات التي ستركز على تحسينها في تدريب الطلاب والمواهب؟

وانغ وي:نحن حاليًا نحتضن المصدر المفتوح بشكل نشط. يتم تنفيذ العديد من المشاريع والموضوعات والتفاعلات بين الأسئلة والأجوبة في الدورات باستخدام مستودعات GitHub. والآن بعد أن أصبح النموذج الكبير هنا، أصبح موقفنا هو نفسه.طالما أنه من الممكن القيام بذلك باستخدام نموذج كبير، فإننا نشجع الطلاب على استخدام النموذج الكبير قدر الإمكان.ونحن نشجع المعلمين أيضًا على الانضمام إلى هذه الممارسات.
بالنسبة لطلاب ومعلمي علوم الكمبيوتر، لا يكفي مجرد استخدام نماذج كبيرة، بل يحتاجون أيضًا إلى فهم المبادئ التي تقوم عليها حتى يتمكنوا من تطوير التطبيقات والأدوات بشكل أفضل. من المؤكد أن النماذج الكبيرة ستحل محل بعض الوظائف والمهن في المستقبل، ولكن تمامًا مثل الثورة الصناعية، على الرغم من أن العديد من العمال فقدوا وظائفهم، إلا أنها أدت أيضًا إلى ظهور المزيد من الصناعات والمهن الجديدة.لذلك، فإننا نقول للطلاب أنه سيكون هناك بالتأكيد المزيد من الصناعات والمهن الجديدة الناشئة في المستقبل، ويجب عليهم الاستعداد لذلك أثناء وجودهم في المدرسة، ويبدأ الاستعداد باحتضانه.
ثانياً، دور رواد الأعمال أيضاً مهم جداً. أنتم منظمات تعمل على خلق فرص العمل.بعد ظهور النموذج الكبير، ظهرت أيضًا مناصب جديدة مثل مهندس الفوريات ومهندس الضبط. سيكون هناك المزيد والمزيد من المناصب الجديدة في المستقبل.هذه هي الفرص التي يخلقها رواد الأعمال.
لقد أنجزت Ant الكثير من العمل في نظام مفتوح المصدر، مثل SOFA وسلسلة من الأعمال مفتوحة المصدر على برامج الوسيطة السحابية الأصلية. يمكن القول بأن هذه الأعمال توفر أساسًا بيئيًا جيدًا للغاية لدعم السحابة الأصلية للصناعة بأكملها. س2: أستاذ شا جيان، هل يمكنك أن تقدم لنا التوجه المستقبلي لشركة Ant في مجال النماذج الكبيرة مفتوحة المصدر؟ وفي الوقت نفسه، كخبير تقني، كيف تقيم عمل Ant في مجال المصدر المفتوح، وما مدى القيمة التي يمثلها هذا العمل لشركة Ant بأكملها؟

شا جيان: النملة تحتضن المصدر المفتوح.إذا تم احتضان المشروع الداخلي بشكل جيد، فستقوم الشركة أيضًا بتشجيع الجميع على فتح المصدر. ولا تمتلك الشركة أي مؤشرات تجارية لهذا الأمر، بل تهدف أكثر إلى تعزيز تأثير التكنولوجيا وبناء صورة شركة التكنولوجيا.
يمكن تقسيم التشكيلة في مجال الذكاء الاصطناعي أو النماذج الكبيرة إلى عدة أجزاء:
أولاً وقبل كل شيء، الأكثر أساسية هو البنية التحتية، والتي تعادل أداة الإنتاج، والشيء بأكمله سيكون مفتوح المصدر. الآن يمكن إصدار الخطوة الأولى من البنية التحتية لتدريب الذكاء الاصطناعي بالكامل في DLRover، وسيتم إصدار جزء التفكير بالكامل، بالإضافة إلى المحاكاة الافتراضية لوحدة معالجة الرسومات، ومجموعات وحدة معالجة الرسومات، وAIDC تدريجيًا.
على مستوى التطبيق، قد لا تكون بعض النماذج الكبيرة المعلن عنها رسميًا مفتوحة بالكامل بسبب مشكلات البيانات، ولكن بعض النماذج الكبيرة الرأسية، مثل CodeFuse، يتم أيضًا فتح المصدر لها تدريجيًا. والآن تتجه العديد من الفرق تدريجيا نحو المصدر المفتوح.
عند الحديث عن مشروع DLRover الخاص بنا، فإننا نفكر أيضًا لماذا يجب أن يكون المصدر مفتوحًا؟ ما هي حالات الاستخدام المحتملة لهذا المشروع؟
يحتاج بعض بائعي الخدمات السحابية مثل Alibaba Cloud وBaidu Cloud إلى بيع خدماتهم الخاصة، لذا فهم يقومون بتطوير تطبيقاتهم وأجهزتهم الخاصة. ومع ذلك، لا يزال هناك العديد من المؤسسات التي لديها الكثير من الأجهزة والباحثين، ولكنها تفتقر إلى فريق البنية التحتية المهنية لاستخدام هذه الأجهزة بكفاءة، وهذا هو بالضبط ما تأمل DLRover المساعدة فيه.وهذا يعادل تمكينهم أو تزويدهم بمجموعة كاملة من الحلول التي تم التحقق منها داخل Ant.وهذا احتمال محتمل؛ هناك أيضًا المستخدم النهائي، مثل المطور الفردي الذي يمكنه تشغيل أحد مكوناتنا بشكل منفصل. لذا فإن الجمهور واسع جدًا.
نريد أن نبني مشروعنا لهؤلاء المستخدمين، لكن ليس لدينا أي أهداف حول كيفية تسويقه أو ما إذا كان من الممكن تسويقه في المستقبل.
وبحسب الملاحظات، هناك عدد قليل للغاية من صناديق الرنمينبي الصينية التي تستثمر في مشاريع مفتوحة المصدر، وفي السابق كانت القوى الرئيسية التي تستثمر في مشاريع مفتوحة المصدر في الصين تتكون أيضًا من بعض صناديق الدولار الأمريكي. المؤسسة الاستثمارية التي يعمل بها السيد شو هي صندوق تمثيلي للعملة الصينية (RMB) وقد استثمرت بشكل مباشر أو غير مباشر في العديد من شركات رقائق الذكاء الاصطناعي/النماذج الكبيرة. س3: باعتبارك صندوقًا يتمتع بأداء خروج جيد، ما هي أفكارك التنظيمية والشخصية بشأن الاستثمار في المصدر المفتوح؟ هل ستكون إيجابيا بشأن الاستثمار في مشاريع مفتوحة المصدر في المستقبل؟ ما هو السبب؟

شو كاي يونج: المصدر المفتوح هو قوة لا يمكن تجاهلها في صناعة البرمجيات.وتتواجد شركتنا أيضًا في مجال المصدر المفتوح، واستثمرت في البنية التحتية للبرمجيات التكنولوجية، وقواعد البيانات، وحوكمة البيانات وغيرها من الشركات ذات الصلة. أنا شخصياً أؤمن بتكنولوجيا المعلومات والبرمجيات والمصدر المفتوح. لقد كنت مستفيدًا ومروجًا للمصدر المفتوح منذ أن بدأت كتابة التعليمات البرمجية في الكلية.
كما أن إدارة صندوقنا بأكمله مفتوحة للغاية. نحن ندعم بقوة الاستثمار في مجال المصدر المفتوح ونواصل الاهتمام بتشجيع اكتشاف مشاريع المصدر المفتوح عالية الجودة. ومع ذلك، ليست كل المؤسسات الاستثمارية منفتحة إلى هذا الحد. لا يفهم بعض المستثمرين المصدر المفتوح تمامًا ويعتقدون أن المصدر المفتوح يعني مجانيًا، مما يزيد أيضًا من عتبة الاستثمار في المصدر المفتوح.
في الماضي، كان الاستثمار في المصادر المفتوحة يتم بشكل أساسي من قبل صناديق الدولار الأمريكي، ولكن الآن اختفت صناديق الدولار الأمريكي من التيار الرئيسي.ومن ثم يتعين على صناديق الرنمينبي أن ترفع أيضاً لواء الاستثمار في البرمجيات مفتوحة المصدر.
النظرة المستقبلية
أُدرجت البرمجيات مفتوحة المصدر في "الخطة الخمسية الرابعة عشرة" للبلاد لأول مرة في عام 2021. وبفضل نموذجها الإبداعي المتميز القائم على المساواة والانفتاح والتعاون والمشاركة، تواصل البرمجيات مفتوحة المصدر لعب دور محوري في تعزيز الابتكار التكنولوجي الرقمي، وتحسين نماذج إنتاج البرمجيات، وتمكين التحول والارتقاء بالصناعات التقليدية، ومساعدة الشركات على خفض التكاليف وزيادة الكفاءة.
وباعتبارها ممثلاً للتكنولوجيات الناشئة المتطورة، فإن النماذج الكبيرة في مرحلة الاستكشاف للمضي قدمًا.يمكن لمجتمع المصدر المفتوح أن يجمع أفضل المواهب في العالم ويعمل معًا لتسريع تكرار النماذج الكبيرة وتحسينها وتنفيذها، وبالتالي تعزيز التحول الرقمي ونجاح الأعمال في جميع الصناعات بمنتجات وخدمات عالية الجودة.
بشكل عام، تتمتع النماذج الكبيرة مفتوحة المصدر بفرص غير محدودة، لكنها تواجه أيضًا العديد من التحديات.في الوقت الحاضر، تتسارع النماذج الكبيرة المحلية لدخول السوق. من سيبرز في المعركة الشرسة بين الآلاف من النماذج؟نرحب بكم لترك آرائكم في قسم التعليقات.
تم نشر هذه المقالة لأول مرة بواسطة هايبر ايه ايمنصة WeChat العامة~