HyperAIHyperAI

Command Palette

Search for a command to run...

물리 정보 처리를 위한 머신러닝 분야의 획기적인 발전! 새로운 GNN 아키텍처를 통해 복잡한 다물체 동역학 시스템을 정확하게 예측할 수 있어 로봇공학, 항공우주 및 재료과학 분야에 혁신을 가져올 것입니다.

Featured Image

최근 인공지능은 이미지 인식 및 자연어 처리와 같은 분야에서 큰 발전을 이루었지만, 복잡한 물리 시스템을 모델링하는 데에는 여전히 많은 어려움이 있습니다. 입자 물질의 운동, 분자 동역학, 인체 운동, 기계 시스템 시뮬레이션과 같은 많은 실제 문제는 다물체 동역학 시스템에 속합니다. 이러한 시스템은 일반적으로 매우 복잡한 상호작용을 가지며 운동량 및 에너지 보존과 같은 기본 물리 법칙을 엄격하게 준수해야 합니다.

기존의 수치 시뮬레이션 방법은 이러한 시스템을 정확하게 설명할 수 있지만, 특히 장기간 시뮬레이션이나 대규모 입자 시스템이 필요한 경우처럼 계산 자원이 막대하게 소모되는 경우에는 계산 비용이 많이 드는 경우가 많습니다.한편, 머신러닝 모델은 데이터로부터 복잡한 관계를 학습할 수 있지만, 물리 법칙에 대한 제약 조건이 부족한 경우가 많아 장기 예측에서 오류가 누적되거나 시스템이 발산하는 결과를 초래할 수 있습니다.

이러한 배경 속에서 물리적 정보를 기반으로 한 머신러닝은 점차 연구의 주요 관심사로 떠오르고 있다.최근 몇 년 동안 그래프 신경망(GNN) 기반의 동적 모델링 방법이 널리 주목받고 있습니다. 생성형 신경망(GNN)은 입자나 강체 사이의 상호작용을 자연스럽게 표현할 수 있습니다. 노드는 객체를 나타내고, 엣지는 상호작용을 나타냅니다. 따라서 GNN은 다중체 시스템 시뮬레이션에 매우 적합합니다. 그러나 GNN과 같은 데이터 기반 방법은 물리적 일관성, 해석 가능성 및 일반화 능력이 부족한 경우가 많습니다.

이 문제를 해결하려면스위스 로잔 연방 공과대학(EPFL)의 연구진은 물리 기반 GNN 아키텍처인 DYNAMI-CAL GraphNet을 제안했습니다. 이 아키텍처는 GNN의 학습 능력과 물리 기반 귀납적 편향을 결합합니다. 선형 운동량 및 각운동량 보존 법칙을 모델 구조에 직접 내장함으로써 이 두 가지 보존 법칙이 명시적으로 보장됩니다.

실험 결과는 DYNAMI-CAL GRAPHNET이 로봇공학, 항공우주공학, 재료과학 등 복잡한 다물체 동역학 시스템의 정확하고 해석 가능하며 실시간 모델링이 요구되는 분야에서 상당한 이점을 제공한다는 것을 보여줍니다. 이 방법은 기본적인 보존 법칙을 준수하는 물리적으로 일관되고 확장 가능한 예측 기능을 제공함으로써, 이질적인 상호작용과 외부 힘을 효율적으로 처리하면서 시스템 내의 힘과 토크를 추론할 수 있습니다.

"동적 시스템을 위한 선형 및 각운동량을 보존하는 물리 기반 그래프 신경망"이라는 제목의 관련 연구 결과는 Nature Communications에 게재되었습니다.

연구 하이라이트:

* 동형 GNN 아키텍처에서 DYNAMI-CAL GRAPHNET은 내부 쌍 간 상호 작용 수준에서 뉴턴의 제3법칙을 적용함으로써 선형 운동량 및 각운동량 보존을 네트워크 구조에 직접 통합합니다.

이 방법은 복잡한 비중심 상호작용 및 소산 효과가 있는 경우에도 물리적으로 일관된 예측을 제공하며 다양한 시스템에 적용할 수 있습니다.

이러한 아키텍처는 제어 시스템 설계, 기계 공정 최적화, 자연 및 엔지니어링 시스템의 동적 거동 분석에 있어 매우 중요한 가치를 지닙니다.

서류 주소:

https://www.nature.com/articles/s41467-025-67802-5
저희 공식 위챗 계정을 팔로우하고 백그라운드에서 "Physics GNN"이라고 답장하시면 전체 PDF 파일을 받으실 수 있습니다.

서로 다른 네 가지 유형의 동적 시스템 데이터 세트

연구팀은 모델의 일반성을 검증하기 위해 서로 다른 네 가지 동적 시스템 데이터셋을 사용하여 실험을 수행했습니다.이 데이터 세트는 물리적 시뮬레이션부터 실제 데이터에 이르기까지 다양한 시나리오를 포괄합니다. 그중에는 다음과 같은 것들이 있습니다.

6자유도 입자 충돌 데이터 세트

연구팀은 6자유도 입자 충돌 시스템을 구축했습니다. 이 시스템에서 각 입자는 병진 운동뿐만 아니라 회전 운동도 할 수 있어 6자유도(6-DoF)를 갖습니다.

훈련 데이터 세트는 각각 60개의 동일한 구체를 포함하는 5개의 궤적으로 구성됩니다.이 구체들은 직사각형의 닫힌 공간에 갇혀 있습니다. 초기 선형 속도는 1~2m/s 범위 내에서 무작위로 할당되고 균일하게 샘플링됩니다. 각 궤적은 10⁻⁴초의 데이터 샘플링 간격으로 1500개의 시간 단계를 포함하며, 기본 물리 시뮬레이션의 시간 단계는 10⁻⁶초입니다. 각 시간 단계에서 각 구체에 대한 위치, 선형 속도 및 각속도의 상태 정보가 기록됩니다.

검증 세트에는 학습에 사용되지 않은 궤적 하나가 포함되어 있습니다. 또한 시스템은 60개의 구체와 200개의 시간 단계로 구성됩니다.초기 속도 크기는 훈련 범위 내에 있지만 속도 방향은 훈련 데이터와 다르며, 이는 모델의 일반화 능력을 테스트하는 데 사용됩니다.

보간 테스트 세트는 검증 세트와 동일하게 설정되지만, 궤적 길이는 500 시간 단계입니다.훈련 데이터 분포 범위 내에서 모델의 장기 예측 능력을 평가하는 데 사용됩니다.

제약 조건이 있는 N체 시스템

고전적인 제약 조건이 있는 N체 동역학 문제의 경우, 혼합된 상호작용 유형 및 구조적으로 제약된 시스템에서 모델의 적용 가능성을 평가하기 위해,연구진은 기존 문헌에서 제안된 제약 조건이 있는 N체 데이터셋을 사용했습니다.이 데이터 세트는 Thomas Kipf 등이 제안한 3차원 대전 입자 시뮬레이션을 확장하여, 시스템을 구성하기 위해 강체 막대와 경첩 형태의 완전한 제약 조건을 도입합니다.

인간 동작 캡처 데이터

세 번째 데이터 세트는 CMU 모션 캡처 데이터베이스의 실제 인간 동작 데이터입니다.이 데이터 세트는 걷기, 달리기, 점프와 같은 움직임 동안 인체 골격 관절의 3차원 위치 변화를 기록합니다. 실험에서 연구진은 한 피험자의 "걷기" 데이터를 선택하여 인체 골격 관절을 그래프 구조로 모델링했습니다. 여기서 노드는 관절을, 엣지는 뼈 연결을 나타냅니다. 이 실험은 주로 실제 복잡한 동작 시스템에서 모델의 성능을 검증하는 데 사용되었습니다.

단백질 분자 동역학

마지막 데이터 세트는 단백질 분자 동역학 시뮬레이션에서 얻은 것입니다.연구진은 MDAnalysis 툴킷을 통해 얻은 아포 아데노신 키나아제(AdK) 평형 궤적 데이터 세트를 사용했는데, 이 데이터 세트는 명시적인 물 분자와 이온이 있는 환경에서 단백질의 원자 수준 움직임을 기록합니다.

DYNAMI-CAL GraphNet: 물리적 정보 기반의 새로운 GNN 아키텍처

DYNAMI-CAL GraphNet의 핵심 아이디어는 물리적 보존 법칙을 신경망 구조에 직접 내장하는 것입니다. 전체 아키텍처는 아래 그림에 나와 있습니다.이는 크게 세 단계로 나눌 수 있습니다.

① 도표 표현;

② 선형 운동량 및 각 운동량 보존을 포함하는 스칼라화-벡터화 방식;

③ 시공간적 메시지 전송.

DYNAMI-CAL GRAPHNET 모델의 전체 아키텍처 및 데이터 흐름

1단계: 그래프 표현

먼저 연구진은 다물체 시스템을 그래프로 표현했습니다. 노드는 객체 또는 입자를 나타내고, 엣지는 객체 간의 상호 작용을 나타냅니다.각 노드는 위치, 속도, 각속도, 객체 속성(질량, 전하 등)과 같은 여러 특징을 포함하며, 엣지는 두 객체 간의 상대적 위치와 상호 작용 관계를 나타냅니다.

두 번째 단계: 스칼라화-벡터화

* 스칼라화

스칼라화 단계에서 모델은 노드와 에지의 벡터 정보를 고차원 스칼라 임베딩으로 변환합니다. 핵심적인 혁신은 각 에지에 3D 회전에 대한 등변성 SO(3), 변환에 대한 불변성 T(3), 노드 교환 시 반대칭성을 포함하는 속성을 가진 로컬 직교 참조 좌표계가 할당된다는 것입니다. 실제 응용에서 이는 에지 방향이 반전될 때 세 개의 기저 벡터의 부호가 바뀌어 이후의 모든 투영 및 상호 작용 계산이 반대칭성을 만족하게 됨을 의미합니다.

스칼라화 단계에서는 노드 벡터 특징(예: 속도 및 각속도)을 해당 에지의 로컬 좌표계에 투영하여 스칼라 성분을 얻습니다. 그런 다음 이러한 스칼라 값을 다른 노드 스칼라 특징과 결합하여 노드 순서에 영향을 받지 않는 에지 임베딩을 생성합니다.이 방법은 시스템 대칭성을 유지하면서 국소적 상호작용에 대한 방향 정보와 스칼라 정보를 모두 인코딩합니다.

* 벡터화

벡터화 단계에서 모델은 에지 임베딩 벡터로부터 내부 힘과 회전 토크를 해독합니다. 그런 다음 이러한 힘들을 노드에 집계하여 입자의 선형 속도, 각속도 및 위치를 업데이트합니다.모델 설계상 힘과 모멘트가 반대칭성을 만족해야 하므로, 시스템은 자연스럽게 선운동량 및 각운동량 보존 법칙을 만족합니다.

3단계: 시공간적 메시지 전달

각 모서리에 작용하는 물리적으로 일관된 내부 힘과 모멘트를 계산한 후이 모델은 DYNAMI-CAL GRAPHNET의 시공간 메시지 전달 메커니즘을 실행합니다.

먼저, 디코딩된 에지 레벨 내부 힘과 회전 토크는 연결된 노드에서 집계되어 각 노드의 합력과 합력 토크를 얻습니다. 그런 다음, 이러한 벡터에 노드 스칼라 임베딩을 통해 얻은 계수를 곱하여 노드의 선형 속도와 각속도를 업데이트합니다. 마지막으로, 암시적 오일러 적분을 사용하여 업데이트된 위치를 계산합니다. 이 과정이 DYNAMI-CAL GRAPHNET의 메시지 전달 계층을 구성합니다.

다음 단계의 에지 인코딩에서, 이처럼 점진적으로 진화하는 표현은 각 에지의 잠재 메모리로 보존되어 모델이 진정한 시공간적 추론을 달성할 수 있게 됩니다.

이러한 설계 덕분에 DYNAMI-CAL GRAPHNET은 각 계산 단계에서 물리 기반의 유도적 편향을 유지하면서 여러 시간 척도에 걸쳐 시스템의 동적 동작을 포착할 수 있습니다.

실험 결론: 안정성과 일반화 능력이 크게 향상되었다.

연구진은 시뮬레이션 시스템과 실제 물리 시스템을 모두 포함하는 네 가지 벤치마크 작업에서 DYNAMI-CAL GraphNet의 성능을 평가했습니다. 여러 데이터셋에 대한 실험 결과, DYNAMI-CAL GraphNet이 여러 지표에서 기존 방법보다 우수한 성능을 보였습니다.

세분화된 6자유도 충돌 벤치마크

직육면체 용기 안에 있는 60개의 구체의 6자유도 운동에 대한 롤링 예측 실험을 수행했습니다. 아래 그림은 DYNAMI-CAL GRAPHNET과 GNS의 결과를 비교한 것입니다.

밀폐된 입자 충돌의 장기 롤링 예측

DYNAMI-CAL GRAPHNET은 모든 입자를 성공적으로 보존하고, 운동 에너지 감소를 정확하게 추적하며, 500단계의 예측 과정 동안 일관된 운동량 변화를 유지하고, 서로 다른 난수 생성기에 걸쳐 최소한의 분산을 보였습니다.반면, GNS는 외삽 시나리오에서 더 일찍 발산하고 입자 탈출 현상을 보인다. 이는 높은 운동량 조건에서 충돌 속도가 증가하여 시스템 제약 조건을 유지하기 위해 충격 접촉력을 정확하게 계산해야 하기 때문이다. GNS는 일반화 능력이 부족하며, 입자가 탈출하지 않는 경우에도 예측 결과가 실제 물리적 거동에서 점차 벗어나는 경향을 보인다.

이러한 결과는 다음과 같은 점을 시사합니다.DYNAMI-CAL GRAPHNET은 소산성, 접촉 밀도가 높은 6자유도 동적 시스템 모델링에서 더 뛰어난 견고성과 일반화 능력을 보여줍니다.

제한된 N체 동역학

전반적으로 DYNAMI-CAL GRAPHNET은 단일 단계 및 다단계 예측 작업 모두에서 모든 기준 모델보다 우수한 성능을 보입니다.

아래 그림 a에서 DYNAMI-CAL GRAPHNET은 다양한 줄기 구성에서 가장 낮은 단일 단계 예측 오차를 달성하여 GMN, EGNN 및 ClofNet보다 우수한 성능을 보였습니다. 이후 연구진은 무작위 회전 및 변환 기능을 도입하여 비등변 GNN의 성능을 크게 향상시키고 등변 모델과의 격차를 좁혔습니다. 그러나 데이터 양이 증가하고 접촉면의 기하학적 대칭성이 명시적으로 고려되었음에도 불구하고, GNN(aug.)은 모든 테스트 구성에서 가장 단순한 등변 모델인 EGNN과 DYNAMI-CAL GRAPHNET에 비해 여전히 성능이 떨어졌습니다.

이는 다음을 나타냅니다.제한된 물리적 역학을 일반화하기 위해서는 아키텍처에서의 귀납적 편향이 여전히 중요합니다.

제약 조건이 있는 N체 벤치마크 테스트에서의 성능 (단일 단계 예측 오차)

다단계 출시 예측의 경우, 아래 그림 b는 DYNAMI-CAL GRAPHNET과 GMN을 비교한 것입니다. 결과는 다음과 같습니다...최대 4단계(1단계 = 10프레임 = 1000 시뮬레이션 단계)의 다단계 롤링 예측에서 DYNAMI-CAL GRAPHNET은 안정적인 장기 예측 정확도를 유지할 수 있습니다.GMN의 예측 오차는 시간이 지남에 따라 점차 누적되어 크게 증가할 것입니다.

제약 조건이 있는 N체 벤치마크 테스트(다단계 롤링 예측)에서의 성능

아래 그림 c는 이전에 보지 못한 (1, 0, 3) 구조 구성에 대한 정성적 롤링 예측 결과를 보여줍니다. 이 모델은 서로 다른 토폴로지를 가진 데이터에 대해 단일 단계 지도 학습만으로 훈련되었지만,제안된 방법은 제약 조건이 있는 시스템의 동적 동작을 여전히 정확하게 포착할 수 있습니다.

제한된 N체 벤치마크 테스트에서의 성능 (정성적 롤링 결과)

인간 동작 예측

인간 동작 캡처 데이터에서, 모델은 단일 단계 지도 학습만을 사용했음에도 불구하고 다단계 예측에서 안정적인 궤적을 유지할 수 있었는데, 이는 모델이 인간 동작의 시공간적 동적 구조를 성공적으로 학습했음을 보여줍니다.

아래 그림 a는 CMU 인간 보행 벤치마크에서 단일 단계 예측 정확도를 보여줍니다. 결과는 다음과 같습니다.DYNAMI-CAL GRAPHNET은 모든 방법 중에서 가장 낮은 오류를 달성하여 GMN보다 우수한 성능을 보였습니다. GMN은 19개의 관절을 사용하여 인체 골격을 표현하고, 수동으로 정의된 6개의 강체 연결을 통해 제약 조건을 적용한 다음, 수작업으로 설계된 순방향 운동학(FK) 모듈을 통해 제약 조건을 적용합니다.

CMU 모션 캡처 벤치마크 테스트 성능 (피험자 #35, 걷기) (단일 단계 예측 오차)

아래 그림 b는 다음과 같은 사실을 보여줍니다. 모델은 단일 단계 지도 학습만을 사용하여 훈련되었지만,DYNAMI-CAL GRAPHNET은 다단계 롤링 예측에서 안정적인 정확도를 유지하는 반면, GMN은 빠르게 발산합니다.

CMU 모션 캡처 벤치마크(피험자) #35보행 성능 (다단계 이동 예측 오차)

아래 그림 c의 정성적 결과는 예측된 관절 궤적이 연속적이고 일관적이며 물리적으로 타당하고 실제 움직임과 매우 일치하며 향후 90프레임 예측에서도 안정적으로 유지될 수 있음을 더욱 잘 보여줍니다.

CMU 모션 캡처 벤치마크(피험자) #35(걷기) 성능 (정성적 롤링 예측 결과)

단백질 동역학

마지막으로 연구진은 복잡하고 열적 교란에 의해 유발되는 단백질 동역학을 모델링하는 모델의 능력을 평가했습니다. 그 결과는 다음과 같습니다.DYNAMI-CAL GRAPHNET은 단백질과 같은 복잡하고 세밀한 시스템에서 탁월한 운동 모델링 기능을 보여줍니다.이 기술은 미세 구조의 진동을 포착할 뿐만 아니라 대규모 형태 변화까지 예측할 수 있으며, 예측 정확도는 기존의 많은 방법보다 뛰어납니다.

물리 시뮬레이션에서 체화된 지능 세계 모델까지

인공지능 기술의 발전과 함께 임베디드 AI라는 새로운 연구 분야가 빠르게 주목받고 있습니다. 텍스트나 이미지를 주로 처리하는 기존 AI와 달리, 임베디드 AI는 지능형 에이전트와 실제 물리적 세계 간의 상호작용을 강조합니다. 로봇, 자율 주행 시스템, 지능형 제조 설비는 모두 임베디드 AI의 중요한 응용 분야입니다. 이러한 시스템에서 지능형 에이전트는 주변 환경을 인지할 뿐만 아니라 환경 변화를 예측하고 그에 따른 행동 전략을 수립해야 합니다. 즉, 물리적 세계의 동적인 움직임을 이해하고 예측할 수 있는 능력을 갖춰야 합니다.

최근 들어 세계 모델이라는 개념을 제안하는 연구자들이 늘어나고 있습니다. 세계 모델이란 환경의 동적 변화를 시뮬레이션할 수 있는 내부 모델을 말하며, 이를 통해 지능형 에이전트는 "머릿속으로" 미래를 예측할 수 있습니다. 하지만 현실적이고 신뢰할 수 있는 세계 모델을 구축하는 것은 결코 쉬운 일이 아닙니다.실제 세계에서 물체의 운동은 운동량 보존 법칙, 마찰력, 충돌 역학 등 복잡한 물리 법칙의 제약을 받습니다. 만약 모델이 이러한 법칙들을 정확하게 반영하지 못하면, 예측 결과는 여러 추론 과정에서 현실과 쉽게 동떨어질 수 있습니다.이러한 배경에서 DYNAMI-CAL GraphNet과 같은 물리적 정보 신경망은 체화된 지능 개발을 위한 새로운 기술적 접근 방식을 제공합니다.

또한, 업계는 복잡한 물리 시스템의 진화를 효율적이고 정확하게 예측하는 데 상당한 진전을 이루었습니다. 물리 시스템은 종종 여러 시간 및 공간 스케일에 걸쳐 진화하지만, 대부분의 학습 모델은 일반적으로 단기적인 동역학만을 기반으로 훈련됩니다. 따라서 장기 예측에 사용될 경우, 복잡한 시스템에서 오류가 누적되어 모델의 불안정성을 초래합니다.

이러한 맥락에서,폴리매틱 AI 협업(Polymathic AI Collaboration)의 연구팀은 위의 문제들을 해결하기 위한 일련의 새로운 방법들을 제시했습니다. 그들은 13억 개의 매개변수를 가지고 트랜스포머(Transformer)를 핵심 아키텍처로 사용하며 유체와 같은 연속체 역학에 주로 초점을 맞춘 월러스(Walrus)라는 기본 모델을 제안했습니다. Walrus는 사전 학습 단계에서 천체 물리학, 지구 과학, 유변학, 플라즈마 물리학, 음향학 및 고전 유체 역학을 포함한 여러 분야를 아우르는 19개의 매우 다양한 물리적 시나리오를 다룹니다. 실험 결과는 Walrus가 후속 작업에 대한 단기 및 장기 예측 모두에서 기존 기준 모델보다 우수한 성능을 보이며, 전체 사전 학습 데이터 분포에 걸쳐 더 강력한 일반화 성능을 나타낸다는 것을 입증합니다.

* 논문 제목: Walrus: 연속체 역학을 위한 영역 간 기초 모델
* 논문 링크:https://arxiv.org/abs/2511.15684

물리 AI 모델 구축은 한편으로는 과학자들이 분자 역학, 재료 과학, 기후 모델과 같은 복잡한 시스템을 더욱 효율적으로 시뮬레이션하는 데 도움을 줄 수 있고, 다른 한편으로는 지능형 로봇에게 더욱 현실적인 세계 이해를 제공할 수 있습니다. 어떤 의미에서, 인공지능이 물리 세계를 진정으로 이해할 수 있도록 하는 것은 일반 인공지능으로 나아가는 중요한 발걸음이 될 수 있습니다.

참고문헌:
1.https://www.nature.com/articles/s41467-025-67802-5
2.https://mp.weixin.qq.com/s/fElxywueQ_an44rXkbjZ1A