Sparsches Lernen stochastischer dynamischer Gleichungen

Mit dem raschen Anstieg der verfügbaren Daten für komplexe Systeme besteht großes Interesse an der Extraktion physikalisch relevanter Informationen aus umfangreichen Datensätzen. Kürzlich wurde ein Rahmenwerk namens Sparse Identification of Nonlinear Dynamics (SINDy) eingeführt, um die regierenden Gleichungen dynamischer Systeme aus Simulationsdaten zu identifizieren. In dieser Studie erweitern wir SINDy auf stochastische dynamische Systeme, die häufig zur Modellierung biophysikalischer Prozesse verwendet werden. Wir beweisen die asymptotische Korrektheit von stochastischem SINDy im Grenzwert unendlicher Daten, sowohl in den ursprünglichen als auch in den projizierten Variablen. Wir diskutieren Algorithmen zur Lösung des dünnbesetzten Regressionsproblems, das bei der praktischen Implementierung von SINDy entsteht, und zeigen, dass Kreuzvalidierung ein wesentliches Werkzeug ist, um das richtige Maß an Dünnbesetzung zu bestimmen. Wir demonstrieren die vorgeschlagene Methodik an zwei Testsystemen: der Diffusion in einem eindimensionalen Potential und den projizierten Dynamiken eines zweidimensionalen Diffusionsprozesses.