HyperAIHyperAI
Back to Headlines

نماذج لغوية كبيرة تُظهر قدرة مماثلة لدماغ الإنسان في فهم المشاهد اليومية

منذ 4 أيام

عند النظر إلى المشهد اليومي، لا يكتفي الدماغ بتمييز الكائنات مثل "كلب" أو "سيارة"، بل يفهم أيضًا السياق العام: ما يحدث، أين يحدث، وكيف ترتبط العناصر ببعضها. لسنوات، كان من الصعب قياس هذا الفهم الغني والمعقد. لكن دراسة حديثة نُشرت في دورية Nature Machine Intelligence تقدم حلًا مبتكرًا باستخدام النماذج اللغوية الكبيرة (LLMs). قائد الدراسة، البروفيسور إيان شارست من جامعة مونتريال، بالتعاون مع باحثين من جامعة مينيسوتا، و대학 أوسنabrück، وفريي جامعة برلين، استخدموا نماذج لغوية كبرى—مثل تلك المستخدمة في أدوات مثل ChatGPT—لتحليل وصفات المشاهد الطبيعية. وبذلك، أنشأوا ما وصفوه بـ"بصمة لغوية" تمثل المعنى الكامن في كل مشهد. وأظهرت النتائج مفاجأة علمية: هذه البصمات اللغوية تطابقت بشكل مذهل مع أنماط النشاط العصبي المسجلة في الدماغ البشري أثناء مشاهدة نفس المشاهد، مثل مجموعة أطفال يلعبون أو أفق مدينة مزدحم. وباستخدام هذه النماذج، يمكن التنبؤ بدقة برد فعل الدماغ تجاه مشاهد مختلفة—سواء كانت متعلقة بالأطعمة، أو الأماكن، أو الوجوه البشرية—فقط من خلال تحليل النصوص الوصفية. وأذهلت الدراسة أكثر عندما أدركت الباحثون أن شبكات عصبية اصطناعية تم تدريبها لاستخلاص هذه البصمات من الصور، أظهرت أداءً أفضل بكثير من أقوى نماذج الرؤية الاصطناعية الحالية، رغم أن هذه النماذج لم تُدرّس على كميات بيانات مماثلة. دعم هذا التصميم فريق البروفيسور تيم كيتزمان من جامعة أوسنabrück، بينما قام البروفيسور آدريان دويريج من فريي جامعة برلين بقيادة الدراسة. يقول شارست: "تُشير نتائجنا إلى أن الدماغ البشري قد يُمثّل المشاهد البصرية المعقدة بطريقة تشبه إلى حد كبير الطريقة التي تفهم بها النماذج اللغوية الحديثة النصوص". هذه الملاحظة تمهد الطريق لتطبيقات واعدة، من تحليل الأفكار وتحسين واجهات الدماغ-الحاسوب، إلى تطوير أنظمة ذكاء اصطناعي أكثر ذكاءً في "الرؤية"، تشبه الطريقة التي يرى بها الإنسان. قد تُسهم هذه التقنيات مستقبلاً في تطوير مساعدات بصرية لذوي الإعاقات البصرية الشديدة، أو في تحسين أنظمة القيادة الذاتية في السيارات. لكن في جوهرها، الدراسة تمثل خطوة كبيرة نحو فهم كيف يُكوّن الدماغ المعنى من العالم البصري، مُنجزاً يربط بين علوم الأعصاب، والذكاء الاصطناعي، والرؤية الحاسوبية.

Related Links

نماذج لغوية كبيرة تُظهر قدرة مماثلة لدماغ الإنسان في فهم المشاهد اليومية | العناوين الرئيسية | HyperAI