CVEvolve، وهي خوارزمية لمعالجة الصور العلمية ذاتية الاكتشاف بدون كتابة أي كود، اقترحها مختبر أرجون الوطني، تمتلك قدرات كاملة تشمل البرمجة والتحقق الذاتي من النتائج وتحسين الاستراتيجية.

منذ شهر واحد

إن التوصل إلى استنتاج علمي موضوعي ودقيق لا يقل صعوبة عن التنقيب عن الذهب في صحراء شاسعة. ويتجلى هذا الأمر بشكل خاص في عصرنا الحالي، مع الانتشار الواسع للأجهزة العلمية المتقدمة وتقنيات المحاكاة.تتميز البيانات التي ينتجها البحث العلمي بحجمها الهائل، وهيكلها غير المنظم، وعدم تنظيمها بشكل كبير.إن عملية معالجة بيانات البحث العلمي تشبه غربلة الرمال للعثور على الذهب؛ لقد أصبحت الخطوة الأكثر أهمية وجوهرية في إطلاق قيمة البيانات وكشف حقيقة البحث العلمي.

ومع ذلك، تكمن المعضلة هنا تحديداً: فغالباً ما يفتقر علماء المجال إلى المهارات المهنية اللازمة لمعالجة البيانات، مثل رؤية الكمبيوتر ومعالجة الصور وهندسة البرمجيات؛ في حين أن الخبراء التقنيين الذين يجيدون معالجة البيانات لا يستطيعون فهم الخلفية التأديبية بعمق ويجدون صعوبة في تصميم سير عمل معالجة تكيفي يناسب سيناريوهات البحث العلمي الحقيقية.

معالجة فجوة المعرفة المهنية الناجمة عن معالجة البيانات العلمية،قام فريق بحثي في مختبر أرغون الوطني (ANL) في الولايات المتحدة بتطوير إطار عمل للوكلاء المستقلين بدون كتابة أي كود يسمى CVEvolve بعد تحليل منهجي لأعمال الأتمتة السابقة القائمة على الذكاء الاصطناعي.صُمم هذا الإطار لاستخراج الخوارزميات اللازمة لمعالجة بيانات البحث العلمي. يتميز بمرونة عالية، إذ لا يتطلب بنية مشكلة محددة مسبقًا أو قوالب عمليات ثابتة. كما يُمكنه تحقيق ربط متكامل بين عناصر متنوعة مثل الشيفرة والبيانات ومقاييس التقييم وسجلات الاسترجاع ونتائج التصور. يدعم هذا الإطار تطوير خوارزميات قابلة للتنفيذ في مجالات رؤية الحاسوب ومعالجة الصور وغيرها. لا يتقيد الإطار بمنهجية نمذجة واحدة، بل يتمتع بقدرات شاملة تتضمن كتابة الشيفرة (تشغيلها)، وتقييم الأثر، والتتبع التاريخي، والتحقق الذاتي من النتائج، والتحسين التكراري الاستراتيجي.

باختصار، يتميز برنامج CVEvolve بقدرته على تطوير خوارزميات متخصصة خاصة به، تتكيف مع سيناريوهات معالجة البيانات العلمية المختلفة في بيئات واقعية. وهذا يُمكّن العلماء في المجالات التي لا تُلمّ بالبرمجة أو معالجة الصور من البدء بسرعة في استخدام أساليب التحليل الذكية دون كتابة سطر واحد من التعليمات البرمجية، وتكون النتائج أكثر شمولية وموثوقية وكفاءة من الطرق السابقة.

تم نشر النتائج ذات الصلة، بعنوان "CVEvolve: اكتشاف الخوارزميات المستقلة لمعالجة البيانات العلمية غير المهيكلة"، على منصة ما قبل الطباعة arXiv.

أبرز الأبحاث:يقترح إطار عمل عام لاكتشاف خوارزميات معالجة البيانات العلمية المستقلة، مصمم خصيصًا للمشاكل غير المهيكلة، مما يلغي الحاجة إلى أطر عمل محددة مسبقًا وقوالب عمليات ثابتة. يقدم CVEvolve بنية بحث طويلة المدى تجمع بين آليات التوليد والضبط والتطوير مع إدارة الحالة الواعية بالمصدر واختبار الاحتفاظ الموجه بالوكيل، مما يضمن مرونة إطار العمل واستقلاليته ونضجه وسهولة استخدامه. تم التحقق من صحة CVEvolve في مهام متنوعة، بما في ذلك تسجيل صور مجهر التألق بالأشعة السينية، واكتشاف قمم براغ، وتجزئة صور مجهر حيود الطاقة العالية، مما يدل على قدرته على اكتشاف خوارزميات عملية وتسريع الاكتشاف العلمي.

عرض الورقة:

https://hyper.ai/papers/2605.11359

تم إنشاء مجموعات بيانات التحقق المخصصة لأنواع المهام الثلاثة.

في هذه الدراسة، تم تصميم جميع مجموعات البيانات خصيصًا لتجربة التحكم.

مجموعة بيانات تسجيل صور المجهر الفلوري

استنادًا إلى صور الأشعة السينية الفلورية الحقيقية، طُبقت تأثيرات اصطناعية مثل إزاحة الإزاحة، وضوضاء بواسون، وارتعاش المسح، والتشويش، لمحاكاة اختلافات الصور الناتجة عن انحراف التركيز الحقيقي. رُسمت الصور باستخدام مقياس لوغاريتمي، وتراوحت أحجامها بين 10 و30 بكسلًا فقط. احتوت مجموعة البيانات على 809 أزواج من صور الاختبار/المرجع، حيث خُصص 101 زوجًا من صور TP3T عشوائيًا كمجموعة اختبار، بينما استُخدمت الصور الـ 901 المتبقية من TP3T لتكرار الخوارزمية وتطويرها.

مجموعة بيانات الكشف عن قمم براغ

تم الحصول على صور الحيود من جميع نقاط المسح، ثم قُسّمت إلى مجموعتين. جُمِعت صور كل مجموعة بكسلًا بكسلًا لإنشاء صورتين. استُخدمت إحدى الصورتين لتقييم الأداء خلال مرحلة تطوير الخوارزمية، بينما استُخدمت الأخرى كمجموعة اختبار. وُضِعت علامات يدوية على قمم براغ في كلتا الصورتين.

مجموعة بيانات تجزئة صور المجهر الحيودي عالي الطاقة: تحتوي مجموعة بيانات التطوير على 5 صور وعلاماتها التي تم إنشاؤها يدويًا، مع تخصيص عينتين لمجموعة الاختبار.

ثلاث عمليات رئيسية وخمس أدوات أساسية لبناء وكيل ذكي قائم على نموذج التعلم الخطي.

من حيث التصميم المعماري العام،CVEvolve عبارة عن وحدة تحكم بحث ذاتية تتمحور حول وكيل نموذج لغوي ضخم. يمكن للوكيل استخدام أدوات لتوليد الحلول المرشحة وتشغيلها وتقييمها، بينما تحدد وحدة التحكم اتجاه الاستكشاف اللاحق بناءً على البيانات التاريخية.تستلهم استراتيجية التكرار من إطار عمل Pty-Chi-Evolve، الذي يتضمن ثلاثة أنواع من خطوات التشغيل: التوليد، والضبط، والتطوير. وقد تم تكييفها لتناسب المزيد من المهام من خلال مجموعة أدوات موسعة وإدارة محسّنة للحالة.

للتحكم في مدة السياق وتقليل التكاليف الحسابية، يُستخدم سياق جديد تمامًا في كل تكرار. يتم الاحتفاظ فقط بمطالبات النظام ومطالبات المهام التي تتوافق مع الإجراءات المُنفذة في هذه الجولة، ولا يتم تجميع سجلات الحوار السابقة. في الجولة نفسها، يمكن تنفيذ عمليتي التوليد والضبط بشكل متزامن بواسطة عدة عمال متوازيين، مما يسمح للنظام باستكشاف حلول جديدة متعددة أو إجراء جولات متعددة من التحسينات والتعديلات لمحتوى أصلي مختلف قبل تحديث سجلات الحوار.

بعد كل جولة، تُصنَّف الخوارزميات المرشحة التي يقدمها البرنامج وفقًا لتسلسلها التطوري، مسجلةً بذلك علاقات التوريث بين الأصل والفرع، وحافظةً على أنماط التصميم المتميزة. يُستعار تصميم أخذ عينات المرشحين من خوارزمية MAP-Elites، ويتم تنفيذه عشوائيًا. في خطوتي الضبط والتطوير، يستخدم CVEvolve أخذ عينات عشوائية من المرشحين بدلًا من اختيار أفضل مرشح حالي دائمًا.

سير عمل من ثلاث مراحل

* مرحلة تجهيز مكان العمل:بدءًا من إعداد مساحة العمل، يتم إعداد بيئة التشغيل، ويتم كتابة مقاييس التقييم من أوصاف المهام أو مطالبات المستخدم تلقائيًا في رمز التقييم القابل للتنفيذ.

* مرحلة التقييم الأساسي:قم بتشغيل وتقييم خوارزميات القياس المعيارية الحالية لتوفير أساس لأعمال المقارنة اللاحقة.

* مرحلة تكرار وتطوير الخوارزمية:تتبع الخوارزمية استراتيجيات التوليد والضبط والتطوير لإجراء جولات متعددة من البحث التكراري. تتولى استراتيجية التوليد مهمة الاستكشاف الشامل وتصميم خوارزميات جديدة باستخدام خيوط متعددة. أما استراتيجية الضبط، فتتولى مهمة التحسين الأساسي، حيث يتم اختيار أفضل الخوارزميات المرشحة عشوائيًا وتحسين معاييرها. بينما تتولى استراتيجية التطوير مهمة التطوير التكراري، حيث يتم دمج مزايا خوارزميات متعددة لتوليد خوارزمية جديدة.

بالإضافة إلى ذلك، ولضمان دقة البحث وعقلانيته، تتضمن العملية الشاملة أيضًا جولات إصلاح اختيارية لإصلاح الخوارزميات المرشحة التي لا يمكن تشغيلها، واختبارًا مستقلاً بعد كل جولة، وبحث SQL في قاعدة بيانات الحالة، وتسجيل المرشحين والمؤشرات وجولات التكرار والسلالات التطورية طوال العملية.

أدوات الدعم الأساسية الخمسة

* أدوات نظام الملفات:يدعم البرنامج عرض الملفات وقراءتها وكتابتها وتحريرها ونسخها ونقلها وحذفها في مساحة العمل، مما يسمح للوكلاء بكتابة رموز المرشحين والبرامج النصية المساعدة وأدوات التقييم في بيئة اختبار الجلسة.

* أدوات إدارة البيئة وتنفيذ التعليمات البرمجية:تثبيت أو إزالة التبعيات في مساحة عمل الدعم، وتنفيذ البرامج النصية بلغة بايثون.

* أدوات عرض الصور:يدعم معالجة الصور ذات الفاصلة العائمة، وتغيير حجم الصور اللوغاريتمي عالي النطاق الديناميكي، وتحويل تنسيق TIFF إلى PNG، ووظائف ضبط أخرى، مما يُمكّن البرنامج من تحديد الهياكل الدقيقة، واختلافات السطوع، والشذوذات التي يصعب اكتشافها في ظل العرض الخطي العادي.

* أداة البحث عن الحالة:يدعم هذا النظام الوكلاء في تحديد المقاييس الأساسية، وتسجيل نتائج التقييم، والتحقق من البيانات التاريخية، وتحليل نتائج المرشحين، وتقديم مرشحين جدد إلى سجلات البحث بلغة الاستعلام المهيكلة.

* أدوات البحث على الويب:إن منح الوصول إلى arXiv و Semantic Scholar و Tavily يسهل تطوير الخوارزميات التكرارية من خلال الاستفادة من المعلومات المرجعية التقنية الخارجية.

بالإضافة إلى ذلك، أُضيفت برمجية وسيطة متعددة الوسائط لمتابعة الصور إلى التصميم لتعويض قصور واجهات نماذج اللغة الكبيرة في نقل الصور مباشرةً. تحديدًا، عندما تُعيد الأداة مسار الصورة، تُعيد تلقائيًا إدراج الصورة المُعالجة كرسالة متابعة في الحوار.

بنية التنفيذ الأساسية

CVEvolve هو تطبيق وكيل يعتمد على LangGraph. يستخدم مخطط عقد مبسطًا أثناء التشغيل، ويعالج البيانات من خلال أربع عمليات أساسية: استقبال الرسائل، واستنتاج النموذج، واستدعاء الأداة، ومعالجة الصور اللاحقة. بعد أن تُعيد الأداة مسار الصورة، تقوم عقدة معالجة الصور بتحويلها إلى بيانات رصد متعددة الوسائط، ثم تُرسلها مرة أخرى إلى النموذج لاستخدامها في جولة الاستنتاج التالية، كما هو موضح في الرسم البياني أدناه.

بنية تنفيذ CVEvolve القائمة على LangGraph

التحقق من جدوى برنامج CVEvolve في ثلاثة أنواع من سيناريوهات معالجة الصور العلمية

ولإثبات الفعالية العملية وقدرة التعميم لـ CVEvolve، قام فريق البحث بتصميم ثلاث مجموعات من تجارب معالجة الصور العلمية الواقعية للتحقق من صحتها.تم إجراء جميع التجارب باستخدام برنامج Claude Opus 4.6.

تسجيل صور المجهر الفلوري

أظهر الباحثون أولاً مهمة CVEvolve في إيجاد خوارزمية قوية للتسجيل الانتقالي لصور المجهر الفلوري بالأشعة السينية (XRF)، والتي تعالج مشكلة معايرة إزاحة الصورة بعد تركيز المجهر.

تتضمن الخوارزميات الأساسية نوعين: ارتباط الطور مع معالج مسبق بنافذة هانينج وتقليل الخطأ بالقوة الغاشمة؛ مقياس مقارنة الأداء هو متوسط المسافة الإقليدية بين التحولات المحسوبة والتحولات الحقيقية.

أظهرت الدراسة، بعد عشرين جولة من البحث، تغيرات الخطأ وخصائص الأداء. في الجولات الأساسية الأولية، بلغ متوسط الخطأ الإقليدي لطريقة تقليل الخطأ بالقوة الغاشمة 1.25، بينما وصل خطأ طريقة ارتباط الطور بعد المعالجة المسبقة بنافذة هانينغ إلى 5.8. بعد جولات التوليد والتطوير اللاحقة، انخفض خطأ التسجيل باستمرار، ليصل إلى 0.8 و0.43 على التوالي، واستقر الأداء بعد الجولة التاسعة. يوضح الشكل أدناه ذلك.

*تباين الخطأ وخصائص الأداء التي أظهرها الخوارزمية بعد 20 جولة من البحث*

لاختيار خوارزمية التسجيل الأمثل، تعتمد هذه الخوارزمية أسلوب تسجيل الصور من العام إلى الخاص. تتمثل الخطوة الأولى في إتمام محاذاة وتحديد موضع البكسلات باستخدام الارتباط التبادلي المعياري متعدد المقاييس. أما الخطوة الثانية، فتجمع بين طرق معالجة مسبقة متنوعة، بما في ذلك دوال التجزئة وخوارزميات التحسين، لتحسين الدقة إلى مستوى البكسل الفرعي. وتتمثل الخطوة الثالثة في ترجيح ودمج مجموعات متعددة من نتائج التقدير بشكل تكيفي وفقًا للإحداثيات، وذلك لإخراج إزاحة نهائية مستقرة وموثوقة.

أظهرت الاختبارات التي أُجريت على مجموعة البيانات المحجوزة والمقارنات مع خوارزميات أساسية مختلفة أن خوارزمية التسجيل المثلى حققت خطأً قدره 0.12، أي أقل بنحو 8 مرات من خوارزمية تقليل الخطأ بالقوة الغاشمة ذات الأداء الأفضل. في الوقت نفسه،قارن الباحثون أيضًا المرشحين الذين اكتشفهم CVEvolve مع أولئك الذين اكتشفهم OpenEvolve. بعد 500 تكرار، استقر الخطأ عند 0.23، وهو أعلى بكثير من خطأ خوارزمية المرشح التي اكتشفها CVEvolve.كما هو موضح في الجدول التالي:

*مقارنة مرشح CVEvolve مع خطوط الأساس الأخرى*

الكشف عن قمم براغ

يهدف هذا البحث إلى إيجاد خوارزمية للكشف عن قمم براغ في صور حيود الأشعة السينية. ويتمثل الهدف في تطوير طريقة لتحديد مواقع قمم براغ داخل وحول المناطق الحلقية المقابلة في مستوى شبكي معين. وتشمل معايير التقييم مقياس F1، والدقة، والاستدعاء.

بما أن مجموعة بيانات التطوير تحتوي على صورة واحدة فقط، فإن الخوارزمية عرضة بشدة لظاهرة التخصيص الزائد، لذا يجب استخدام مجموعة اختبار منفصلة لمراقبة أداء التعميم. تظهر النتائج في الشكل أدناه. يستمر مقياس F1 لصورة مجموعة التطوير في الارتفاع، حتى يقترب في النهاية من الدرجة المثالية 1، بينما يبلغ مقياس F1 لمجموعة الاختبار المحجوزة ذروته في الجولة الخامسة تقريبًا، ثم يبدأ في الانخفاض الحاد بعد الجولة التاسعة.

*سجلات البحث عن اكتشاف قمم براغ بناءً على سير عمل اكتشاف النقاط الساخنة*

بعد ذلك، نختار المرشح الأمثل في الجولة الخامسة. أولًا، نخفي المنطقة غير الصالحة، ثم نُنشئ خريطة نسبة الإشارة إلى الضوضاء بطرح الخلفية باستخدام إحداثيات قطبية على شكل قوس وتطبيع الضوضاء المحلية. ثم نستخدم خوارزمية تكميلية متعددة الجولات لإيجاد قيمة الذروة. أخيرًا، ندمج نقطة المركز ونتحقق منها ونُحسّنها لإخراج إحداثيات الذروة النهائية.

وتظهر النتائج أنيمكن للحل الأمثل المرشح أن يخفف بشكل فعال من عمليات الكشف الخاطئة، مع تقليل عدد عمليات الكشف الفائتة وتحديد المزيد من القمم المصنفة.حقق المرشح الأفضل تحسينات في الأداء مقارنةً بالخط الأساسي في جميع المقاييس: ارتفع مؤشر F1 من 0.298 إلى 0.788، وارتفع مؤشر الدقة من 0.237 إلى 0.839، وارتفع مؤشر الاستدعاء من 0.400 إلى 0.743 (وهو ما يعادل عدد حالات عدم الكشف). انظر الشكل أدناه.

*نتائج الكشف للمرشح ذي أعلى خط أساس وأعلى درجة F1 لذروة براغ.*

تجزئة صورة الحيود

تمثلت مهمة هذه الدراسة في تجزئة صور حيود متعددة البلورات، وتكمن الصعوبة في التمييز الدقيق بين حلقات الحيود وقمم براغ. استخدمت التجربة مؤشر التقاطع إلى الاتحاد الموزون (IoU) وأجرت 40 جولة من الملاحظات. أظهرت النتائج...كانت نسبة التقاطع إلى الاتحاد للمرشحين الأساسيين الأوليين الذين أنشأهم العامل، من خلال طرح الخلفية وتقسيم العتبة لتحديد الميزات، في النهاية 0.37 فقط، وهو ما يعتبر منخفض الدقة.كما هو موضح في الشكل أدناه.

بعد ذلك، ومن خلال تتبع مقاييس اختبار الاحتفاظ، تم اختيار الخوارزمية المرشحة الأمثل في الجولة السادسة عشرة. حُوِّلت الخوارزمية المرشحة إلى صورة حيود لوغاريتمية، وحُسبت معلمات مركز الشعاع والخلفية الشعاعية، ثم حُددت النتائج الحلقية وجرى التحقق منها من خلال فحوصات الاتساق الشعاعي والسمت. قُسِّمت البكسلات بناءً على عتبة الخلفية، وأخيرًا نُقِّيت قمم الحيود ووُضِع قناع تجزئة.

نتائج CVEvolve حول خوارزمية تجزئة HEDM على مجموعة بيانات Holdout

أظهرت النتائج أنه في التجربة الأولى، كان القناع الحلقي المتوقع أعرض وأكثر سمكًا من محيط خط الأساس الفعلي، ولكن بعد التحقق الدقيق، تأكد الكشف الناجح عن معظم البنى الحلقية، كما تم تجزئة قمم براغ المختلفة بشكل جيد. وكان القناع المتوقع متطابقًا بدرجة عالية مع محيط خط الأساس الفعلي. في التجربة الثانية، لم يتم تحديد عدد قليل من البنى الحلقية في المنطقة الخارجية.

الكلمات الأخيرة

باختصار، يُسهّل تطوير CVEvolve بدون كتابة أي كود بشكل كبير الوصول إلى تقنية التصوير الحاسوبي، مما يوفر للعلماء في هذا المجال طريقة مختصرة لإجراء معالجة بيانات علمية مُخصصة. ومن المتوقع أن تُعزز CVEvolve قدراتها في المستقبل، كما هو موضح في الورقة البحثية، من خلال التوسع في معالجة البيانات عالية المستوى وتحسين سير العمل في الوقت الفعلي. وهذا بدوره سيدفع بسير العمل العلمي المستقل إلى عصرٍ يعتمد على الذكاء والتكنولوجيا معًا.

CVEvolve، وهي خوارزمية لمعالجة الصور العلمية ذاتية الاكتشاف بدون كتابة أي كود، اقترحها مختبر أرجون الوطني، تمتلك قدرات كاملة تشمل البرمجة والتحقق الذاتي من النتائج وتحسين الاستراتيجية.

منذ شهر واحد

عرض الورقة:

https://hyper.ai/papers/2605.11359

تم إنشاء مجموعات بيانات التحقق المخصصة لأنواع المهام الثلاثة.

في هذه الدراسة، تم تصميم جميع مجموعات البيانات خصيصًا لتجربة التحكم.

Command Palette