HyperAI

سلسلة دروس Deepmoney 1: النموذج المالي الكبير القائم على تدريب Yi-34b

مقدمة البرنامج التعليمي

تم إنتاج هذا البرنامج التعليمي وإصداره بواسطة مدير مشروع Deepmoney Xingye Yuanyuan في عام 2024. ويهدف إلى تقديم تفسيرات متعمقة للسوق وتحليلات مالية للتعويض عن أوجه القصور في المعرفة العامة في المجال المالي الفعلي. تحتوي سلسلة دروس Deepmoney على ثلاثة نماذج: Deepmoney-yi-34b، وDeepmoney-miqu-70b، وDeepmoney-67b-full.يستخدم هذا البرنامج التعليمي Deepmoney-34b-full.

يتم تدريب Deepmoney-34b-full بناءً على Yi-34b-200k وينقسم إلى مرحلتين: pt (تدريب المعلمات الكاملة) و sft (ضبط Lora الدقيق). تتضمن بيانات التدريب تقارير بحثية عالية الجودة تغطي البيانات من عام 2019 إلى ديسمبر 2023، بشكل أساسي من شركات الوساطة التقليدية ومؤسسات البحث المهنية.

يمكن العثور على النموذجين الآخرين في سلسلة الدروس التعليمية هذه هنا:

* سلسلة النماذج المالية الكبيرة - البرنامج التعليمي 2: Deepmoney-67b-full

* سلسلة النماذج المالية الكبيرة - البرنامج التعليمي 3: Deepmoney-miqu-70b

1. خلفية البحث

تعتمد أغلب النماذج المالية المزعومة اليوم على المعرفة العامة، ولكن في المجال المالي الفعلي، غالباً ما تكون هذه المعرفة العامة غير كافية لتفسير السوق الحالي. إذا كنت مهتمًا، فيمكنك التعرف على المقترحات المختلفة لكينز وفريدمان وحتى التمويل السلوكي الحالي. علاوة على ذلك، يتغير السوق كل لحظة، وتتوفر كمية كبيرة من الأخبار والبيانات الضخمة في الوقت الفعلي. لماذا لا نستخدم نموذجًا كبيرًا لإنشاء خط أنابيب؟ في خطتي، هذا النموذج هو النموذج الأساسي لهذه العملية. وفي خطتي، فإن النماذج مثل جامع المعلومات، والحكم على الهدف، والمحلل النوعي، والمحلل الكمي، ومستخرج البيانات، كلها جزء من هذه العملية. ولكن من المهم بلا شك أن يتمكن النموذج نفسه من إتقان مجموعة واسعة من الأساليب النوعية والكمية. ولهذا السبب ولد هذا النموذج.

2. حول البيانات:

الكثير من المعرفة العامة مشكوك في صحتها - ولكن هذا لا يعني أنها خاطئة. ويعتمد الدعم النظري للعديد من أساليب البحث في التقارير البحثية أيضًا على هذه المعرفة. لذلك، في تدريبي، قمت بجمع بعض الكتب الجامعية وبعض الكتب المهنية. الكمية ليست كثيرة ولكن الجودة جيدة. بالإضافة إلى ذلك، قمت باختيار كمية كبيرة من بيانات تقارير البحث من ديسمبر 2019 إلى 2023 - وقد نشرت هذه التقارير من قبل مجموعة متنوعة من الناشرين، بما في ذلك الوسطاء التقليديين ومؤسسات البحث. معظمها مدفوع الأجر ومتاح للمؤسسات فقط.

إذا قرأت تقارير بحثية، وخاصة التقارير عالية الجودة، فستجد أن تقارير البحث عبارة عن حكم شخصي + تحليل كمي، وأن دعم البيانات في التحليل الكمي أمر بالغ الأهمية للسلسلة المنطقية بأكملها. لاستخراج هذه البيانات، قمت بإنشاء خط أنابيب يلخص سياق تقرير البحث كجزء من المطالبة.

وأخيرًا، قمت بخلط البيانات. لا يتم تضمين أي بيانات المعرفة العامة لأنه مصمم للجشع. علاوة على ذلك، فإن المعرفة الواردة في تقارير أبحاث الصناعة شاملة بما فيه الكفاية.

س: أولاً، قم بتقسيم تقرير البحث إلى عدة أجزاء حسب الفصول. في سياق ذلك، دعونا نطرح أسئلة حول محتوى تقرير البحث (يمكنك الاستمرار في اختبار المزيد هنا، وتأثير claude3 أفضل). ثم استخدم Nous-Capybara-34B للإجابة على الأسئلة وشظية تقرير البحث المقابلة. السبب في فصل السائل عن المجيب هو منع النموذج من "السؤال والإجابة على نفسه" وعدم الإجابة وفقًا لتقرير البحث ولكن تضمين مخرجاته الخاصة. وهذا يسمح باستخراج المعرفة والأساليب الموجودة في تقارير البحث. بالإضافة إلى ذلك، استخدمت gpt4 لاستخراج الأصول الأساسية (إن وجدت) من تقرير البحث ووضعها في الترتيب. في حالة الاستخدام التي أتخيلها، أريد أن أقدم الهدف في التعليمات ومصدر الأخبار الذي يزحف إليه الزاحف في الوقت الفعلي، جنبًا إلى جنب مع وكيل يطرح الأسئلة تلقائيًا، حتى يتمكن النموذج من التفكير في الأحداث الجارية.

3: حول التدريب:

تم تدريب هذا النموذج باستخدام إطار تدريب llama-factory. للاستخدام المحدد، يرجى الرجوع إلى:hiyouga/LLaMA-Factory: توحيد الضبط الدقيق الفعال لأكثر من 100 برنامج ماجستير في القانون (github.com)

يمر هذا النموذج بمرحلتين: pt و sft.

4: تقييم النموذج:

دعونا نأخذ عينة من الأحداث الأخيرة، ونحاكي عملية تحليل الأوراق المالية القائمة على الأحداث في العالم الحقيقي، ونجري اختبارًا مقارنًا ضد deepmoney وgpt4. نظرًا لأن تأثير الأحداث على السوق غير مرئي نسبيًا، فمن الصعب تقييم التأثيرات دون عملية اختبار خلفية صارمة. ويجب تحليل مخرجاتنا باستخدام العديد من الأساليب الكمية. لذا قمت بنشر النتائج هنا حتى يتمكن الجميع من إجراء تقييم بديهي لنتائج الإنتاج. لدي نظام تتبع الأخبار العالمية. هناك الكثير من الأخبار في جميع الأوقات. في عمليتي، أقوم بإزالة التكرارات وإصدار أحكام ذاتية وموضوعية على هذه الأخبار. يمكن حل هذه المشكلات باستخدام BERT التقليدي. ثم بالنسبة لـ deepmoney، يتم استخدام ثلاث خطوات هنا لمعالجة الأخبار الواردة: 1. ما هي قطاعات الصناعة أو أهداف الاستثمار التي قد تتأثر بالأخبار المذكورة أعلاه؟ 2. يرجى تصميم طريقة كمية لدراسة تأثير الأخبار المذكورة أعلاه على صناعة ____. وبناءً على ذلك، قم بشرح البيانات التي يجب استخدامها على وجه التحديد. 3. بناءً على البيانات التالية، يرجى _____ تصميم طريقة كمية محددة لتحليل تأثير الأخبار المذكورة أعلاه على صناعة ____ كميًا.

ومن بينها السؤال الأول المتعلق بالحكم الذاتي، واستخراج هدف التأثير الإخباري. ويعتمد هذا بشكل أكبر على قدرة التحليل الذاتي للنموذج. ثم قم باستخراج اسم الصناعة من الإجابة الأولى (بالنسبة لأولئك الذين هم على دراية بالنموذج الكبير، فمن السهل تصميم عملية آلية) وقم بملئه في السؤال الثاني للحصول على بيانات للتحليل الكمي. السبب الذي يجعلنا نسأل عن الأساليب الكمية أولاً ثم البيانات هو سحر COT. الجواب على السؤال الأخير هو ما نحتاجه حقا. إن سياق هذا السؤال يوفر معلومات كافية لتتطلب طريقة كمية دقيقة ومحددة. من خلال الجمع بين النموذج المكتوب بالكود ونموذج استدعاء الوظيفة، يصبح هذا ممكنًا تمامًا إذا كان لديك قاعدة بيانات كبيرة وصغيرة مع قاموس بيانات كامل. الإجابات المذكورة أعلاه هي الإجابات المكونة من ثلاث خطوات من deepmoney و gpt4. لقد حدث هذا الخبر للتو في 20240115 الساعة 9:35 صباحًا بتوقيت بكين.