아르곤 국립 연구소에서 제안한 제로 코드, 자체 발견 기능을 갖춘 과학 이미지 처리 알고리즘인 CVEvolve는 코딩, 결과 자체 검증 및 전략 최적화를 포함한 풀 스택 기능을 보유하고 있습니다.

16일 전

객관적이고 엄밀한 과학적 결론에 도달하는 것은 광활한 사막에서 금을 채취하는 것만큼이나 어렵습니다. 특히 오늘날처럼 첨단 과학 기기와 시뮬레이션 기술이 널리 보급된 시대에는 더욱 그렇습니다.과학 연구에서 생성되는 데이터는 양이 방대하고, 구조가 느슨하며, 매우 비정형적입니다.과학 연구 데이터 처리 과정은 마치 모래를 체로 걸러 금을 찾는 것과 같습니다. 이는 데이터의 가치를 발굴하고 과학 연구의 진실을 밝히는 데 있어 가장 중요하고 핵심적인 단계가 되었습니다.

하지만 문제는 바로 여기에 있습니다. 해당 분야 과학자들은 컴퓨터 비전, 이미지 처리, 소프트웨어 엔지니어링과 같은 데이터 처리 관련 전문 기술이 부족한 경우가 많고, 데이터 처리에 능숙한 기술 전문가들은 해당 분야의 배경지식을 깊이 이해하지 못해 실제 과학 연구 시나리오에 맞는 적응형 처리 워크플로우를 설계하는 데 어려움을 겪습니다.

과학 데이터 처리에서 발생하는 전문 지식 격차 해소미국 아르곤 국립 연구소(ANL)의 연구팀이 과거 AI 기반 자동화 연구를 체계적으로 분석한 결과, CVEvolve라는 제로 코드 자율 에이전트 프레임워크를 개발했습니다.이 프레임워크는 과학 연구 데이터 처리에 필요한 알고리즘을 개발하도록 설계되었습니다. 사전 정의된 문제 구조나 고정된 프로세스 템플릿 없이도 뛰어난 유연성을 제공하며, 코드, 데이터, 평가 지표, 검색 기록, 시각화 결과 등 다양한 요소를 폐쇄 루프 방식으로 연결할 수 있습니다. 컴퓨터 비전, 이미지 처리 등 다양한 분야에서 실행 가능한 알고리즘 개발을 지원하며, 특정 모델링 방식에 국한되지 않고 코드 작성(실행), 효과 평가, 이력 추적, 결과 자체 검증, 전략적 반복 최적화 등 풀스택 기능을 제공합니다.

요약하자면, CVEvolve는 실제 상황에서 다양한 과학 데이터 처리 시나리오에 맞춰 특화된 알고리즘을 자체적으로 개발할 수 있습니다. 이를 통해 프로그래밍이나 이미지 처리에 익숙하지 않은 분야의 과학자들도 단 한 줄의 코드도 작성하지 않고 지능형 분석 방법을 신속하게 시작할 수 있으며, 기존 방식보다 더욱 포괄적이고 신뢰할 수 있으며 효율적인 결과를 얻을 수 있습니다.

"CVEvolve: 비정형 과학 데이터 처리를 위한 자율 알고리즘 발견"이라는 제목의 관련 연구 결과는 논문 사전 공개 플랫폼인 arXiv에 게재되었습니다.

연구 하이라이트:* 본 논문에서는 비정형 문제를 위해 특별히 설계된 자율적인 과학 데이터 처리 알고리즘 발굴을 위한 일반적인 프록시 프레임워크를 제안합니다. 이를 통해 사전 정의된 문제 프레임워크와 고정된 프로세스 템플릿의 필요성을 없앴습니다. * CVEvolve는 생성, 조정, 진화 메커니즘을 소스 인식 상태 관리 및 에이전트 기반 유지 테스트와 결합한 장거리 탐색 아키텍처를 도입하여 프레임워크의 유연성, 자율성, 성숙도 및 유용성을 보장합니다. * CVEvolve는 X선 형광 현미경 이미지 정합, 브래그 피크 검출, 고에너지 회절 현미경 이미지 분할 등 다양한 작업에서 검증되었으며, 실용적인 알고리즘을 발굴하고 과학적 발견을 가속화하는 능력을 입증했습니다.

논문 보기:

https://hyper.ai/papers/2605.11359

세 가지 유형의 작업에 대해 각각 전용 검증 데이터 세트가 구축되었습니다.

본 연구에서 모든 데이터 세트는 대조 실험을 위해 특별히 맞춤 설계되었습니다.

형광 현미경 이미지 정합 데이터 세트

실제 XRF 이미지를 기반으로, 초점 이동에 따른 이미지 차이를 시뮬레이션하기 위해 변환 시프트, 포아송 노이즈, 스캔 지터 및 흐림 현상을 인위적으로 적용했습니다. 이미지는 로그 스케일로 그려졌으며 크기는 10~30픽셀에 불과했습니다. 데이터 세트는 809쌍의 테스트/참조 이미지로 구성되었으며, 이 중 101쌍의 TP3T 이미지는 무작위로 홀드아웃 세트로 할당되었고, 나머지 901쌍은 알고리즘 반복 및 개발에 사용되었습니다.

브래그 피크 검출 데이터 세트

모든 스캔 지점에서 회절 이미지를 얻은 후 두 그룹으로 나누었습니다. 각 그룹의 이미지를 픽셀 단위로 중첩하여 두 개의 이미지를 생성했습니다. 한 이미지는 알고리즘 개발 단계에서 성능 평가에 사용했고, 다른 이미지는 검증용 데이터셋으로 사용했습니다. 두 이미지 모두에서 브래그 피크를 수동으로 표시했습니다.

고에너지 회절 현미경 이미지 분할 데이터셋: 개발 데이터셋은 5개의 이미지와 수동으로 생성된 레이블로 구성되어 있으며, 2개의 샘플은 테스트 세트로 사용됩니다.

LLM 기반 지능형 에이전트 구축을 위한 세 가지 주요 프로세스와 다섯 가지 핵심 도구.

전반적인 건축적 측면에서 볼 때,CVEvolve는 대규모 언어 모델 에이전트를 중심으로 하는 자율 탐색 제어기입니다. 에이전트는 도구를 사용하여 후보 솔루션을 생성, 실행 및 평가할 수 있으며, 제어기는 과거 데이터를 기반으로 후속 탐색 방향을 결정합니다.이 반복 전략은 Pty-Chi-Evolve 프레임워크에서 영감을 받았으며, 생성, 조정, 진화의 세 가지 작업 단계를 포함합니다. 확장된 도구 세트와 개선된 상태 관리를 통해 더 많은 작업에 적용할 수 있도록 설계되었습니다.

컨텍스트 길이를 제어하고 계산 비용을 줄이기 위해 각 반복마다 완전히 새로운 컨텍스트가 사용됩니다. 시스템 프롬프트와 이번 라운드에서 수행된 작업에 해당하는 작업 프롬프트만 유지되며, 이전 대화 기록은 누적되지 않습니다. 동일한 라운드에서 생성과 조정은 여러 병렬 워커에 의해 동시에 실행될 수 있으므로 시스템은 대화 기록을 업데이트하기 전에 여러 새로운 솔루션을 탐색하거나 다양한 원본 콘텐츠에 대해 여러 라운드의 최적화 및 조정을 수행할 수 있습니다.

각 라운드가 끝날 때마다 에이전트가 제출한 후보 알고리즘들은 진화 계보에 따라 그룹화되어 부모-자식 상속 관계를 기록하고 우수한 설계 패턴을 보존합니다. 후보 알고리즘 샘플링 아키텍처는 MAP-Elites 알고리즘에서 차용했으며 무작위로 수행됩니다. 튜닝 및 진화 단계에서 CVEvolve는 항상 현재 최적의 후보를 선택하는 대신 무작위 후보 샘플링을 사용합니다.

3단계 워크플로

* 작업 공간 준비 단계:작업 공간 준비부터 시작하여 런타임 환경이 설정되고, 작업 설명이나 사용자 프롬프트에서 가져온 평가 지표가 실행 가능한 평가 코드에 자동으로 기록됩니다.

* 기초 평가 단계:기존 벤치마크 알고리즘을 실행하고 평가하여 후속 비교 작업을 위한 기준선을 제공합니다.

* 알고리즘 반복 및 개발 단계:이 알고리즘은 생성, 조정, 진화 전략을 사용하여 여러 차례 반복적인 탐색을 수행합니다. 생성 전략은 광범위한 탐색을 담당하고 여러 스레드를 활용하여 새로운 알고리즘을 설계합니다. 조정 전략은 기본적인 최적화를 담당하며, 최적의 후보 알고리즘을 무작위로 선택하고 해당 매개변수를 최적화합니다. 진화 전략은 반복적인 진화를 통해 여러 알고리즘의 장점을 결합하여 새로운 알고리즘을 생성합니다.

또한, 연구의 엄격성과 합리성을 보장하기 위해 전체 과정에는 실행되지 않는 후보 알고리즘을 수정하기 위한 선택적 수정 단계, 각 단계 후 독립적인 테스트, 상태 데이터베이스에 대한 SQL 검색, 그리고 과정 전반에 걸쳐 후보, 지표, 반복 단계 및 진화 계보를 기록하는 작업이 포함됩니다.

5가지 핵심 지원 도구

* 파일 시스템 도구:워크스페이스에서 파일 목록 보기, 읽기, 쓰기, 편집, 복사, 이동 및 삭제를 지원하여 에이전트가 세션 샌드박스에서 후보 코드, 도우미 스크립트 및 평가 도구를 작성할 수 있습니다.

* 환경 관리 및 코드 실행 도구:지원 작업 공간에 종속성을 설치하거나 제거하고, 파이썬 스크립트를 실행합니다.

* 이미지 보기 도구:이 프로그램은 부동 소수점 이미지 처리, 고해상도 이미지의 로그 스케일링, TIFF를 PNG 형식으로 변환하는 기능 등 다양한 조정 기능을 지원하여 일반적인 선형 렌더링으로는 감지하기 어려운 미묘한 구조, 밝기 변화 및 이상 징후를 식별할 수 있도록 합니다.

* 검색 상태 도구:이 시스템은 상담원이 핵심 지표를 설정하고, 평가 결과를 기록하고, 과거 데이터를 검증하고, 후보자 결과를 분석하고, 구조화된 쿼리 언어를 사용하여 검색 기록에 새로운 후보자를 제출하는 것을 지원합니다.

* 웹 검색 도구:arXiv, Semantic Scholar, Tavily에 대한 접근 권한을 부여함으로써 외부 기술 참조 정보를 활용하여 반복적인 알고리즘 개발을 용이하게 할 수 있습니다.

또한, 대규모 언어 모델 인터페이스가 이미지를 직접 전송할 수 없다는 한계를 보완하기 위해 멀티모달 이미지 후속 미들웨어가 설계에 추가되었습니다. 구체적으로, 도구가 이미지 경로를 반환하면 렌더링된 이미지를 후속 메시지로 대화창에 자동으로 다시 삽입합니다.

핵심 기반 실행 아키텍처

CVEvolve는 LangGraph 기반의 에이전트 애플리케이션입니다. 런타임 시 단순화된 노드 그래프를 사용하며, 메시지 수신, 모델 추론, 도구 호출, 이미지 후처리라는 네 가지 핵심 프로세스를 통해 데이터를 처리합니다. 도구가 이미지 경로를 반환하면, 이미지 처리 노드는 이를 멀티모달 관측 데이터로 변환하여 다음 추론 단계에서 사용할 수 있도록 모델로 다시 전달합니다(아래 다이어그램 참조).

세 가지 유형의 과학적 이미지 처리 시나리오에서 CVEvolve의 실용성 검증

CVEvolve의 실질적인 효과와 일반화 능력을 입증하기 위해 연구팀은 실제 과학 이미지 처리 실험 세 가지를 특별히 설계하여 검증했습니다.모든 실험은 Claude Opus 4.6을 사용하여 수행되었습니다.

형광 현미경 이미지 등록

연구진은 먼저 CVEvolve의 과제를 X선 형광 현미경(XRF) 이미지의 병진 정합을 위한 견고한 알고리즘을 찾는 데 적용하여 현미경 초점 조절 후 이미지 오프셋 보정 문제를 해결했습니다.

기준 알고리즘에는 해닝 윈도우 전처리기를 사용한 위상 상관법과 무차별 대입 오류 최소화법의 두 가지 유형이 있습니다. 성능 비교 지표는 계산된 변위와 실제 변위 사이의 평균 유클리드 거리입니다.

20번의 탐색 과정을 거친 후, 본 연구는 오류 변화와 성능 특성을 보여줍니다. 초기 기준선 단계에서 무차별 대입 오류 최소화의 평균 유클리드 오류는 1.25였으며, 해닝 윈도우 전처리를 거친 위상 상관법의 오류는 최대 5.8에 달했습니다. 이후 생성 및 진화 단계를 거치면서 등록 오류는 지속적으로 감소하여 각각 0.8과 0.43에 도달했고, 9번째 단계 이후 성능이 안정화되었습니다. 이는 아래 그림에 나타나 있습니다.

최적의 정합 알고리즘을 선택하기 위해, 본 알고리즘은 세밀한 정합으로 나아가는 방식을 채택합니다. 첫 번째 단계는 다중 스케일 정규화 상호 상관을 통해 정수 픽셀 수준의 정렬 및 위치 지정을 수행하는 것입니다. 두 번째 단계에서는 스플라인 함수 및 최적화 알고리즘을 포함한 다양한 전처리 방법을 결합하여 서브픽셀 수준의 정확도를 달성합니다. 세 번째 단계에서는 좌표에 따라 여러 추정 결과를 적응적으로 가중치 부여하고 통합하여 안정적이고 신뢰할 수 있는 최종 오프셋 값을 출력합니다.

홀드아웃 세트에 대한 테스트와 다양한 기준 알고리즘과의 비교를 통해 최적의 등록 알고리즘의 오차가 0.12로, 성능이 더 우수한 무차별 대입 오차 최소화 알고리즘보다 거의 8배 낮은 것으로 나타났습니다. 한편,연구진은 CVEvolve가 발견한 후보들과 OpenEvolve가 발견한 후보들을 비교했습니다. 500번의 반복 후, 오차는 0.23으로 안정화되었는데, 이는 CVEvolve가 발견한 후보 알고리즘의 오차보다 상당히 높은 수치였습니다.다음 표에서 볼 수 있듯이:

브래그 피크 검출

본 실험의 목적은 X선 회절 이미지에서 브래그 피크를 검출하는 알고리즘을 찾는 것입니다. 구체적인 목표는 주어진 격자면의 해당 환형 영역 내부 및 주변에서 브래그 피크를 식별하고 위치를 파악하는 방법을 개발하는 것입니다. 평가 지표로는 F1 점수, 정밀도(Precision), 재현율(Recall)을 사용합니다.

개발 데이터셋에는 이미지가 하나만 포함되어 있기 때문에 알고리즘이 과적합될 가능성이 매우 높으므로 일반화 성능을 모니터링하기 위해 홀드아웃 데이터셋을 사용해야 합니다. 결과는 아래 그림에 나와 있습니다. 개발 데이터셋 이미지의 F1 점수는 계속 상승하여 만점인 1에 근접하는 반면, 예비 테스트 데이터셋의 F1 점수는 5라운드 부근에서 최고점을 찍은 후 9라운드 이후 급격히 감소하기 시작합니다.

다음으로, 5번째 라운드에서 최적의 후보를 선택합니다. 먼저, 유효하지 않은 영역을 마스킹하고, 호 모양의 극좌표를 사용하여 배경을 빼고 국부적인 노이즈를 정규화하여 신호 대 잡음비 맵을 생성합니다. 그런 다음, 다단계 보완 알고리즘을 사용하여 피크 값을 찾습니다. 마지막으로, 중심점을 병합, 검증 및 최적화하여 최종 피크 좌표를 출력합니다.

결과는 다음과 같습니다최적의 후보 솔루션은 오탐지를 효과적으로 완화하는 동시에 미탐지 횟수를 줄이고 더 많은 레이블이 지정된 피크를 식별할 수 있습니다.최적의 후보는 모든 지표에서 기준선 대비 성능 향상을 달성했습니다. F1 점수는 0.298에서 0.788로, 정밀도 점수는 0.237에서 0.839로, 재현율 점수(미탐지율)는 0.400에서 0.743으로 증가했습니다. 아래 그림을 참조하십시오.

*브래그 피크에 대해 가장 높은 기준선 점수와 F1 점수를 받은 후보의 검출 결과입니다.*

회절 이미지 분할

본 연구의 목표는 다결정 회절 이미지 분할이었으며, 그 핵심 과제는 회절 고리와 브래그 피크를 정확하게 구분하는 것이었다. 실험에서는 가중 교차-합집합(IoU) 지수를 사용하였고, 총 40회의 관찰을 수행하였다. 결과는 다음과 같다...에이전트가 배경 제거 및 임계값 분할을 통해 특징을 식별하여 생성한 초기 기준선 후보의 최종 교집합 비율은 0.37에 불과하여 정확도가 낮았습니다.아래 그림과 같습니다.

이후, 유지율 테스트 지표를 추적하여 16번째 라운드에서 최적의 후보 알고리즘을 선정했습니다. 선정된 후보 알고리즘을 로그 스케일 회절 이미지로 변환하고, 빔 중심과 방사형 배경 매개변수를 계산한 후, 방사형 및 방위각 일관성 검사를 통해 환형 결과를 식별하고 검증했습니다. 배경 임계값을 기준으로 픽셀을 분할하고, 최종적으로 회절 피크를 정제하여 분할 마스크를 생성했습니다.

CVEvolve의 Holdout 데이터셋에 대한 HEDM 분할 알고리즘 분석 결과

첫 번째 시뮬레이션에서는 예측된 환형 마스크가 실제 기준선 윤곽보다 폭과 두께가 더 넓었지만, 면밀한 검증 결과 대부분의 환형 구조가 성공적으로 검출되었고 다양한 브래그 피크도 잘 분할되었음을 확인했습니다. 예측된 마스크는 실제 기준선 윤곽과 높은 적합도를 보였습니다. 두 번째 시뮬레이션에서는 외곽 영역의 일부 환형 구조가 식별 및 검출되지 않았습니다.

마지막 말

요약하자면, CVEvolve의 제로 코드 개발 방식은 컴퓨팅 이미징 기술의 진입 장벽을 크게 낮춰 현장 과학자들이 맞춤형 과학 데이터 처리를 수행할 수 있는 지름길을 제공합니다. 논문에 설명된 바와 같이, CVEvolve는 향후 고수준 데이터 처리 및 실시간 워크플로우 최적화 기능으로 확장하여 그 역량을 더욱 강화할 것으로 기대됩니다. 이는 자율적인 과학 발견 워크플로우를 지능과 기술에 기반한 시대로 이끌어갈 것입니다.

아르곤 국립 연구소에서 제안한 제로 코드, 자체 발견 기능을 갖춘 과학 이미지 처리 알고리즘인 CVEvolve는 코딩, 결과 자체 검증 및 전략 최적화를 포함한 풀 스택 기능을 보유하고 있습니다.

16일 전

"CVEvolve: 비정형 과학 데이터 처리를 위한 자율 알고리즘 발견"이라는 제목의 관련 연구 결과는 논문 사전 공개 플랫폼인 arXiv에 게재되었습니다.

논문 보기:

https://hyper.ai/papers/2605.11359