
초록
복잡한 시스템에 대한 사용 가능한 데이터의 급속한 증가로 인해, 대용량 데이터셋에서 물리적으로 관련 있는 정보를 추출하는 데 큰 관심이 집중되고 있습니다. 최근에는 시뮬레이션 데이터로부터 동역학 시스템의 지배 방정식을 식별하기 위한 프레임워크인 Sparse Identification of Nonlinear Dynamics (SINDy)가 소개되었습니다. 본 연구에서는 SINDy를 생물물리 과정 모델링에 자주 사용되는 확률적 동역학 시스템으로 확장합니다. 우리는 무한한 데이터 한계에서 원래 변수와 투영된 변수 모두에 대해 확률적 SINDy의 점근적 정확성을 증명합니다. 또한 SINDy의 실제 구현에서 발생하는 희소 회귀 문제를 해결하기 위한 알고리즘을 논의하며, 교차 검증이 적절한 희소성 수준을 결정하는 데 필수적인 도구임을 보여줍니다. 제안된 방법론은 1차원 포텐셜 내의 확산과 2차원 확산 과정의 투영 역학을 포함하여 두 개의 테스트 시스템에서 시연됩니다.