Command Palette

Search for a command to run...

NeurIPS 2025 | MIT는 천문학, 물리학, 생물의학 분야에서 비정상 데이터에 매우 민감한 자동화된 과학적 발견 도구인 AutoSciDACT를 제안했습니다.

Featured Image

역사를 통틀어 과학적 발견은 종종 우연의 요소를 수반해 왔습니다. 예를 들어, 페니실린은 곰팡이 낀 페트리 접시에서 우연히 발견되었고, 우주 마이크로파 배경 복사는 안테나에 포착된 "비정상적인 잡음"에서 비롯되었습니다. 이러한 의도치 않은 관찰은 궁극적으로 인류 문명의 발전을 이끄는 핵심 동력이 되었습니다. 오늘날 "데이터 집약적인" 연구 환경에서 방대한 양의 학제간 데이터는 더욱 기이하고 설명할 수 없는 관찰 결과를 포함하고 있어, 이론적으로 우연한 과학적 발견의 가능성을 배가시킵니다. 그러나 역설적이게도, 복잡하고 방대한 양의 연구 데이터에서 "새로운 발견"을 정확하게 포착하는 것은 건초더미에서 바늘을 찾는 것보다 훨씬 더 어렵습니다.

전통적인 과학적 발견 방법은 과학자의 직관과 전문성에 크게 의존하여, "새로운 발견"의 진정한 과학적 가치를 판단하기 위해 관찰, 연구, 가설, 실험, 그리고 검증이라는 복잡한 과정을 요구합니다. 그러나 과학 데이터의 기하급수적인 증가와 복잡성 증가로 인해, 예리한 관찰만으로 "새로운 발견"을 찾아내는 것은 이제 사실상 불가능합니다. 인공지능과 대규모 언어 모델을 기반으로 한 자동화된 과학적 탐구 방법이 최근 유망한 결과를 보이고 있지만,그러나 엄격하고 자동화된 가설 검정 및 검증이 가능한 통합 프레임워크가 부족하기 때문에이런 방법을 사용하더라도 "의지는 있으나 능력이 부족하다"는 것은 불가피하다.

과학적 발견의 과제를 해결하기 위해 MIT, UW-매디슨, 국립과학재단 인공지능 및 기본 상호작용 연구소(IAIFI)의 팀은 AutoSciDACT(변칙적 대조 시험을 통한 자동화된 과학적 발견)라는 방법을 제안했습니다.이는 과학 데이터에서 "새로운 발견"을 자동으로 탐지하는 데 사용할 수 있으므로 과학적 탐구가 간소화됩니다.연구자들은 천문학, 물리학, 생물의학, 영상 분야의 실제 데이터 세트와 합성 데이터 세트에서 이 방법을 검증했으며, 이를 통해 이 방법이 모든 도메인에 걸쳐 소량의 비정상적 데이터가 주입되었을 때에도 매우 민감하다는 것을 보여주었습니다.

"AutoSciDACT: 대조적 임베딩과 가설 검정을 통한 자동화된 과학적 발견"이라는 제목의 관련 연구 결과가 NeurIPS 2025에 게재되었습니다.

연구 하이라이트:

* AutoSciDACT는 과학 데이터의 참신성을 감지하기 위한 종단 간 일반 프레임워크로, 도메인 간 전송이 가능합니다.

* 과학적 시뮬레이션 데이터, 수동으로 레이블이 지정된 데이터 및 전문가 지식을 비교 차원 축소 워크플로에 통합하여 체계적인 프로세스가 설계되었습니다.

* 관찰된 이상 현상의 중요성을 정량화하고 통계적 관점에서 이상 현상이 과학적으로 중요한지 여부를 결정하기 위해 통계적으로 엄격한 프레임워크가 구축되었습니다.

* 결과는 4가지 상당히 다른 과학 분야의 실제 데이터로 검증되었으며, 상당한 효과, 설득력, 홍보 가치가 있음을 보여주었습니다.

서류 주소:

https://openreview.net/forum?id=vKyiv67VWa

공개 계정을 팔로우하고 " 오토사이닥트 전체 PDF를 받으세요

더 많은 AI 프런티어 논문:
https://hyper.ai/papers

데이터 세트: 다양하고 학제 간 데이터 세트는 AutoSciDACT의 탁월한 성능을 검증합니다.

AutoSciDACT의 우수한 성능을 엄격하게 검증하기 위해,연구자들은 완전히 다른 도메인의 5개 데이터세트를 대상으로 이를 테스트했습니다.이러한 데이터 세트에는 천문학, 물리학, 생물의학, 영상이라는 4가지 분야의 데이터와 합성적으로 구성된 데이터 세트가 포함됩니다.

천문학적 데이터 세트에 관하여,연구팀은 워싱턴주 핸포드와 루이지애나주 리빙스턴에 있는 레이저 간섭계 중력파 관측소(LIGO)에서 2019년 4월부터 2020년 3월까지 세 번째 관측을 통해 기록된 중력파 데이터를 천문학적 벤치마크로 선정했습니다. 이 데이터는 간섭계당 한 채널씩, 두 채널에서 수집된 50밀리초 시계열 신호로 구성되며, 4096Hz 주파수(채널당 200회 측정)로 샘플링되었습니다. "순수 잡음", "계측기 간섭", "알려진 천체물리학적 신호", 그리고 "백색 잡음 버스트(WNB)"라는 숨겨진 신호(이상 신호) 등 다양한 범주의 데이터가 포함되었습니다. WNB 신호는 사전 훈련 과정에서 제외되었다가, 이후 데이터에 주입하여 모델이 중력파 신호에서 이 보이지 않는 신호를 식별할 수 있는지 검증했습니다.

물리학 데이터 세트연구팀은 입자물리학 벤치마크로 대형 강입자 충돌기(LHC)에서 양성자-양성자 충돌로 인한 "제트"를 시뮬레이션한 대규모 데이터셋인 JETCLASS 데이터셋을 선택했습니다. 이 연구는 양자색역학(QCD) 과정(쿼크/글루온), 탑 쿼크 붕괴(t → bqq′), 그리고 W/Z 벡터 보손 붕괴(V → qq′)에서 발생하는 제트를 포함하는 이 데이터셋의 일부를 사용했습니다. 강화된 히그스 보손 붕괴에서 바텀 쿼크로 발생하는 신호 제트(H → bb¯)도 포함했습니다. 연구팀은 입자물리학에 적합한 트랜스포머 아키텍처의 변형인 입자 변환기(ParT)를 대조 인코더로 사용했습니다.

심장 조직, 간 조직 및 비알코올성 지방간 질환의 예시 다이어그램입니다.

생물의학 분야에서연구팀은 염색된 조직 샘플의 공개된 광학 현미경 이미지를 사용했습니다. 참조 샘플에는 7가지 유형의 마우스 조직(뇌, 심장, 신장, 간, 폐, 췌장, 비장)과 한 가지 유형의 정상 쥐 간 조직이 포함되었습니다. 연구 목표는 비알코올성 지방간 질환(NAFLD)으로 인한 비정상적인 마우스 간 조직을 검출하는 것이었습니다. 입력 샘플은 전체 절편 이미지에서 추출한 256 x 256 픽셀 해상도의 조직 절편으로, 메이슨 트리크롬 염색법을 사용하여 염색했습니다. 사용된 백본 네트워크는 EfficientNet-B0입니다.

이미지 과학 측면에서,연구팀은 CIFAR-10 이미지 데이터셋(총 5만 개의 이미지)을 사용하여 첫 번째 클래스를 이상 클래스로 무작위로 선택하고 나머지 9개 클래스에 대해 사전 학습을 진행했습니다. 발견 단계에서 연구팀은 CIFAR-10 테스트 세트를 CIFAR-5m 이미지 10만 개로 보완하여 가설 검정에 사용할 수 있는 데이터 포인트 수를 늘렸습니다. 인코더 백본은 사전 학습된 가중치를 갖는 ResNet-50을 사용했으며, 최종 완전 연결 계층만 약간 더 큰 MLP로 대체하고 CIFAR 대조 임베딩 작업에서 미세 조정했습니다.

합성 데이터 세트에 관하여,이 연구의 주요 목적은 AutoSciDACT의 핵심 기능을 시연하고 실제 과학 데이터셋의 특정 세부 정보에 영향을 받지 않음을 검증하는 것입니다. 합성 데이터셋은 D개의 의미 있는 차원과 M개의 노이즈 차원을 포함하는 X⊂R^D+M으로 구성됩니다. 노이즈 차원은 0에서 1까지 균일하게 생성되는 반면, 의미 있는 차원은 0-1의 균일한 평균과 무작위로 생성된 공분산(균일 분포 0, 0.5)을 갖는 N개의 가우시안 클러스터로 구성됩니다. 그런 다음 모든 차원을 무작위로 회전시켜 원래의 유효 판별 변수를 숨깁니다. 훈련은 대조 임베딩 방법을 사용하여 수행되며, N-1개의 클러스터만 훈련 데이터로 사용하고 하나의 클러스터를 감지할 "신호"로 예약합니다. 훈련에 사용되는 기본 모델은 단순 다층 퍼셉트론(MLP)입니다.

또한, 모델의 교차 영역 일반화 능력을 더욱 검증하기 위해 나비 잡종 식별을 위한 유전체 데이터셋과 LHC 힉스 보손의 테트렙톤 붕괴에 대한 실제 데이터셋과 같은 다른 데이터셋을 보완 검증에 포함했습니다. 요약하자면, 이러한 다양한 데이터셋은 모두 "배경 데이터" + "비정상 신호 데이터"를 사용하여 구축되었으며, 각각 모델 사전 학습과 모델의 신규성 감지 여부 감지에 사용되었습니다. 검증 결과는 모두 AutoSciDACT가 과학 데이터에서 신규성을 감지하는 일반적인 프로세스로서 효과적일 뿐만 아니라 교차 영역 일반화 능력도 우수함을 보여줍니다.

모델 아키텍처: "사전 훈련" + "발견"의 2단계 프로세스로 과학적 발견을 위한 새로운 방법 창출

AutoSciDACT의 핵심은 "사전 훈련 - 발견"이라는 두 단계로 구성됩니다.저차원 특징 임베딩을 통계적 테스트와 결합하면 고차원 과학 데이터에서 통계적으로 유의미한 "새로운 신호"를 추출할 수 있습니다.

과학적 방법(1부)과 AutoSciDACT 프로세스(2부)의 비교

특히, 사전 학습 단계는 고차원 데이터 중복성 문제를 해결합니다. 이 단계는 주로 원본 과학 데이터에 포함될 수 있는 수백 또는 수천 차원의 입력 특징들을 저차원 벡터로 압축하는 동시에, 데이터의 핵심 의미 특징, 즉 과학적 관점에서 핵심 정보는 그대로 유지하여 후속 분석의 기반을 마련합니다.

구현 측면에서 사전 학습된 파이프라인의 핵심은 대조 학습을 통해 학습된 인코더 fθ : X → Rᵈ입니다. 이 인코더는 고차원 입력 공간 X의 원시 데이터를 Rᵈ의 저차원 표현으로 매핑합니다. 대조 목적 함수는 학습 공간에서 유사 입력(양의 쌍) 간의 정렬을 극대화하는 동시에 유사하지 않은 입력(음의 쌍)을 분리하도록 설계되었습니다. 기본 프레임워크는 SimCLR을 사용하여 인코더 fθ와 투영 헤드 gϕ를 학습합니다.학습 후에는 최종 저차원 임베딩을 출력하기 위해 인코더 fθ만 유지됩니다.실제로는 지도 대조 학습(SupCon)이 사용됩니다. 이는 레이블이 지정된 학습 데이터를 사용하여 동일 클래스의 양수 쌍과 다른 클래스의 음수 쌍을 생성하며, 손실 함수는 SupCon 손실입니다. 양수 쌍 생성을 보완하기 위해 도메인 지식을 통합하여 데이터 증강 전략을 설계할 수 있습니다. 또한, 지도 교차 엔트로피 손실(LCE)을 선택적으로 추가하여 총 손실 L = LSupCon + λCELCE(여기서 λCE는 분류 목표가 지배하지 않도록 0.1에서 0.5 사이의 값을 가짐)를 얻을 수 있습니다.

발견 단계에서는 NPLM(New Physics Learning Machine) 프레임워크 내에서 이전 단계에서 얻은 저차원 임베딩을 활용하여 이상 감지 및 가설 검정을 수행합니다.검색 데이터에서 잠재적인 "새로운 신호"를 검색하고 통계적 테스트를 통해 그 중요성을 정량화합니다.

이 단계에서 연구자들은 임베딩 벡터 fθ를 사용하여 보이지 않는 데이터 집합을 처리하고 저차원 공간에서 배경 분포에서 벗어나는 이상치, 밀도 왜곡 또는 이상치를 탐색합니다. 탐색 과정은 고전적인 과학적 가설 검정 접근법을 사용하여, 알려진 배경으로 구성된 참조 데이터 집합 R과 알려지지 않은 구성의 관측 데이터 집합 D를 비교하여 R과 D가 동일한 분포를 갖는다는 귀무가설을 채택하거나 기각합니다. 가설은 NPLM 알고리즘(Neyman 등이 제안한 고전적인 우도비 검정 기반)을 사용하여 검정합니다.표현력이 풍부한 학습된 임베딩 벡터와 결합하면 이 모델은 새로운 신호에 매우 민감해집니다.

사전 학습 중 차원 축소는 매우 중요합니다. NPLM을 포함한 모든 통계적 검정 방법의 효과는 데이터 차원이 증가함에 따라 크게 감소하기 때문입니다. 다시 말해, 차원이 높을수록 통계적으로 유의미한 작은 신호를 감지하기 위해 더 큰 표본 크기가 필요하지만, 실제 과학 연구에서는 표본 크기가 이러한 고차원적 요건을 충족하지 못하는 경우가 많습니다. 따라서 고차원 데이터를 압축해야만 NPLM과 같은 도구가 효과적으로 작동하여 통계적으로 유의미한 이상치를 발견하고 과학적 가치를 높일 수 있습니다.

실험 결과: 다차원 및 광범위한 도메인 비교를 통해 AutoSciDACT의 이전 가능성과 도메인 간 기능이 강조됨

연구자들은 동일한 방법을 사용하여 각 데이터 세트에서 AutoSciDACT를 훈련하고 평가했으며, 각 데이터 세트의 특정 요구 사항에 맞게 사전 훈련 단계에서 사소한 조정만 했습니다.

모든 인코더의 임베딩 차원은 d=4입니다. 임베딩 결과는 아래 그림과 같이 시각화됩니다.또한, 실험에서는 감독 벤치마크, 이상적 감독 벤치마크, 마할라노비스 기준선을 포함한 세 가지 유형의 비교 벤치마크를 설정했습니다.

물리학 및 천문학 데이터 세트의 비교 임베딩

아래 그림에서 볼 수 있듯이, 결과는 NPLM이 11TP³T만큼 낮은 신호 비율에서도 통계적으로 유의미한 편향(Z≳3 또는 p≲10⁻³)을 검출할 수 있음을 보여줍니다. 임베딩 공간의 신호 분포를 완전히 이해하는 두 개의 지도 학습 기준선은 신호 민감도에 대한 합리적인 상한선을 제공하며, 경우에 따라 NPLM의 성능이 이 한계에 근접합니다. 약 5σ 이상에서는 일부 추세가 유효하지 않게 되지만, 이 유의 수준(p∼10⁻⁷)에서는 결과가 기계적으로 정의됩니다.

실험 결과

합성 데이터 외에도다른 모든 데이터 세트에서 NPLM은 마할라노비스 거리 기준선보다 상당히 우수한 성능을 보였습니다.이는 입력 공간에서 다양한 왜곡을 모델링할 수 있기 때문입니다.

LIGO 및 JETClass 데이터셋의 경우, 제안된 방법은 Z-점수 3으로 지도 학습 상한에 근접하며, 이는 각 분야의 모든 이상 탐지 알고리즘과 유사하거나 이를 능가하는 수준입니다. 천문학과 입자물리학은 오랫동안 통계적으로 발전된 이상 탐지 기법을 활용해 왔지만, 이를 조직학에 적용하면 여러 과학 분야로의 방법론적 적용 가능성을 보여줍니다.

조직학적 측면에서 보면,실험 결과, 레이블 정보를 사용하여 구성된 임베딩 공간이 데이터 증강만을 기반으로 구성된 임베딩 공간보다 우수한 것으로 나타났습니다.연구진은 AutoSciDACT의 도움으로 조직의 작은 부분에만 존재할 수 있는 국소적 이상을 감지할 수 있는 새로운 방법을 개발했습니다. 이 기술은 질병의 조기 발견과 병리학자가 독성 화합물을 식별하는 데 중요한 역할을 합니다.

데이터가 폭발적으로 증가하는 시대에 "AI 과학자"가 현실이 되었습니다.

AI 열풍이 거세게 불어닥치며 모든 것을 파괴할 위기에 처해 있습니다. 과학 연구의 최전선인 과학 탐구는 AI의 힘으로 전례 없는 변화를 겪고 있으며, AI 열풍에 의해 근본적으로 재편되는 핵심 분야로 자리 잡고 있습니다.

앞서 언급한 논문에서 언급된 AutoSciDACT 외에도같은 분야에서 구글, 스탠포드 대학 등의 팀도 인간 과학자를 모방할 수 있는 AI 공동 과학자를 제안했습니다.인간처럼 아이디어를 생성하고, 토론하고, 질문하고, 최적화하고, 개선할 수 있습니다. 특히, Gemini 2.0을 기반으로 구축된 다중 에이전트 시스템으로, 과학자들이 새롭고 독창적인 지식을 발견하고, 기존 증거와 Science Journal에서 제공하는 연구 목표 및 지침에 기반하여 검증 가능한 혁신적인 연구 가설과 해결책을 제시할 수 있도록 지원합니다.
논문 제목:AI 공동 과학자를 향하여
서류 주소:https://arxiv.org/abs/2502.18864

더욱이 AI의 과학 연구 수행 능력은 계속해서 확장되고 있으며, 심지어 "전자 연구에 대해 자동으로 생각하는 것"에서 "완벽한 과학 논문 작성"으로까지 발전하고 있습니다. 옥스퍼드 대학교와 컬럼비아 대학교 연구팀은 그러한 AI 과학자를 제안했습니다.이는 완전 자동화된 과학적 발견을 위한 최초의 포괄적 프레임워크입니다.이를 통해 고급 대규모 언어 모델이 독립적으로 연구를 수행하고 연구 결과를 전파할 수 있습니다. 간단히 말해, 이 AI 과학자는 새로운 연구 아이디어를 도출하고, 코드를 작성하고, 실험을 수행하고, 결과를 시각화하고, 완전한 과학 논문을 작성하여 연구 결과를 설명하고, 평가를 위해 시뮬레이션된 동료 평가 과정을 진행할 수 있습니다.
논문 제목:AI 과학자: 완전 자동화된 개방형 과학적 발견을 향하여
서류 주소:https://arxiv.org/abs/2408.06292

올해 상반기에 AI Scientist는 AI Scientist-v2로 진화하여 주요 업그레이드를 거쳤습니다. 이전 버전과 비교했을 때,AI Scientist-v2는 더 이상 인간이 이식할 수 있는 코드 템플릿에 의존하지 않습니다. 다양한 머신 러닝 도메인에서 효과적으로 일반화할 수 있습니다.이 솔루션은 전담 시험 관리 에이전트가 관리하는 새로운 점진적 에이전트 트리 탐색(Progressive Agent Tree Search) 방법을 채택하고, 시각 언어 모델(VLM) 피드백 루프를 통합하여 AI 검토 구성 요소를 강화하고 그래프의 내용과 미적 요소를 반복적으로 최적화합니다. 연구진은 ICLR(International Journal of Research and Research)의 동료 평가 워크숍에 완전히 자체 작성한 세 편의 원고를 제출하여 AI Scientist-v2를 평가했으며, 매우 긍정적인 결과를 얻었습니다. 한 편의 원고는 평균적인 인간 기준을 초과하는 높은 점수를 받았으며, 이는 완전히 AI로 생성된 논문이 동료 평가를 통과한 최초의 사례입니다.
논문 제목:AI 과학자-v2: 에이전트 트리 검색을 통한 워크숍 수준의 자동화된 과학적 발견
서류 주소:https://arxiv.org/abs/2504.08066

AI와 과학 탐구는 가설 수립 지원에서 완전 자율 과학 연구, 그리고 단일 영역 검증에서 광범위한 학제 간 응용에 이르기까지 깊이 통합되고 진화하고 있음이 분명합니다. 이러한 시스템은 기존 과학적 발견의 효율성 병목 현상을 극복할 뿐만 아니라 과학적 발견을 "경험 중심"에서 "데이터 중심"으로 전환하는 데 기여합니다. 앞으로 인간-기계 협업 모델의 실현을 통해 AI는 과학계에 효율적인 발견의 새로운 장을 열고 세계 문명의 발전에 새로운 동력을 불어넣을 것입니다.