最適なパフォーマンスを達成するために必要なトレーニング サンプルは 5% のみです。清華大学の研究チームは、長距離の人流シミュレーションを実現するための条件付きノイズ除去拡散モデル SPDiff をリリースしました。

特色图像

群集シミュレーションは、特定の状況における多数の人々の動きをシミュレートするプロセスです。この技術は主にコンピュータゲーム、都市計画、建築設計、交通機関などの分野で使用されています。たとえば、さまざまな条件 (群衆の密度、流れなど) の下で建物内の群衆の動きをシミュレーションすることは、意思決定者が建物の設計を評価して最適化し、緊急対応と避難の効率を向上させるのに役立ちます。

この分野の研究は大幅に進歩し、急速に発展していますが、運動能力、感覚能力、さまざまな心理的要因の影響により、さまざまな状況における個人の行動が複雑になっています。このような異質な母集団は計算の複雑さが高いため、群集シミュレーションの現実性を制限するさまざまな課題が存在します。

清華大学電子工学部都市科学コンピューティング研究センター、清華大学深セン国際大学院深センユビキタスデータエンパワーメント重点研究室、彭城研究室の研究者らは最近、AAAIで論文「社会物理学に基づく拡散モデル」を発表した。 2024年の群集シミュレーション》,新しい条件付きノイズ除去拡散モデル SPDiff が提案されています。これは、相互作用ダイナミクスを効果的に利用して、社会的力によって導かれる拡散プロセスを通じて群衆の行動をシミュレートできます。

このモデルは、多粒子動的システムの運動特性からインスピレーションを得て、等分散性の強力な誘導バイアスも統合して、モデルの変換に対する一般化能力を強化し、より優れたパフォーマンスを実現します。さらに、モデル結果の長距離の物理的一貫性を確保するために、モデルは拡散モデルに適した長距離トレーニング アルゴリズムをさらに開発しました。この手法では、人の流れの性質を記述する社会力モデルなどの社会物理知識を深層学習モデルの設計に組み込み、知識とデータのコラボレーションによって推進される研究パラダイムを実現します。

論文リンク:

https://arxiv.org/abs/2402.06680

コードリンク:

https://github.com/tsinghua-fib-lab/SPDiff

公式アカウントをフォローし、バックグラウンドで「Human Flow」に返信すると論文全文をダウンロードできます

群衆の動きの不均一性と多態性

歩行者移動シミュレーションは、特定のシーンにおける多数の人の動きを微視的にシミュレートするプロセスであり、主に群衆の動きに対するグループの相互作用の影響に焦点を当てています。この技術は、都市計画、建築設計、交通管理などの分野で主に応用されています。たとえば、公共交通機関のインターチェンジ (空港や駅など) での人々の動きを現実的にシミュレーションすることで、大量の乗客の流れに直面したときのインターチェンジの効率と安全性を分析し、建築空間の最適化についての理解をさらに促進できます。

社会力モデルの数式表現
端駆動力 f目的地、歩行者反発力 fペド、環境と障害物の反発力 f環境

群衆の移動には、異質性とマルチモダリティという 2 つの中心的な特性があります。

まず第一に、群衆の中での個々の行動は不均一であり、個人の好みや周囲の環境の影響を受けて、人間は複雑な時空間の軌跡を描きます。たとえば、ショッピング モールでは、歩行者は個人の興味やショッピング モールのレイアウトに基づいて、異なる経路をたどりながら、異なる速度で移動します。その結果、人々は時間の経過とともに変化する多様で複雑な動作パターンを生成し、その結果、現実的な軌跡が得られます。

初期の研究手法では、物理法則に基づいたモデルを使用して社会物理学の分野で歩行者の動きの背後にあるメカニズムを説明し、社会力モデルなどの異質な特性から歩行者の動きの本質的な特徴を抽出しようとしました。これらの方法には、シミュレートされた軌道が現実的ではなく、十分に自然ではないという問題があります。

第 2 に、人間の行動に固有の不確実性が、歩行者の軌跡の不確実性をもたらします。これは、人間の移動の多態性とよく呼ばれます。初期の研究では、ガウス分布を使用してマルチモーダリティをモデル化するなど、軌道の確率分布に関する仮定を単純化し、その後の手法では、敵対的生成ネットワーク (GAN) や変分オートエンコーダ (VAE) などの生成モデルを利用してマルチモーダル サンプルを生成しました。

近年、普及モデルとして多くの世代タスクにおいて最先端の性能を発揮している拡散モデルは、現実のシミュレーションを実現するために、注意が必要な上記の2つの観点を総合的に考慮することを期待しています。拡散モデルの使用 複雑な多峰性分布のモデリングに優れたパフォーマンスを発揮し、社会力モデルに代表される社会物理学的知識を利用して、この研究における拡散モデルのフレームワークの設計をガイドします。

拡散モデル+マルチフレーム演繹学習アルゴリズム:長距離移動シミュレーションを実現

社会力モデルは、観測データの分布を段階的に再構成する拡散モデルとは異なり、群衆の動きを多粒子動的システムに変換し、時間フレームごとに各歩行者の観測データに直接物理的制約を課します。したがって、中間プロセスのノイズ除去中にノイズを含むデータの操作にこの知識を組み込むことは困難です。


一方、歩行者の動きのシミュレーションには、複数の歩行者と複数の時間枠に対するデータ生成タスクが含まれます。既存の方法は通常、拡散モデルを利用してシーケンス全体を一度に生成します。しかし、この研究の問題では、シミュレートされた軌道全体を一度に生成することは、各時間フレームでの社会的力モデルと組み合わせて各歩行者を効果的に誘導することはできません。

さらに、ワンショット生成では、生成されるデータの高次元の性質により、効率と有効性の問題が発生する可能性があります。したがって、シミュレーション結果の安定性を維持しながら長期シミュレーションを達成することは、既存の拡散モデル フレームワークにとって困難な問題です。

上記の課題に対処するために、この研究では歩行者動作シミュレーション用の条件付きノイズ除去拡散モデルを提案します。このモデルには次のような特徴があります。

* ノイズ除去プロセスをガイドするために社会的力モデルから洞察を得る群集インタラクション モジュールが含まれています。

* 複数粒子の動的システムから導出された等変特性を統合し、変換におけるモデルの汎化能力を強化し、データ効率を最適化します。

メソッドの全体的な枠組み

図に示すように、SPDiff は、グラフ ネットワークを使用してシーンをモデル化します。グラフでは、各歩行者は、有向エッジを通じて、視野内の近くの歩行者や障害物とのインタラクション関係を確立します。提案する拡散モデルは、グラフのノードとエッジの情報、履歴ステータス、歩行者のエンドポイント情報を条件入力として使用し、拡散モデルを使用して次の時間枠での歩行者の将来の加速度の分布をサンプリングし、ステータスを更新します。次の瞬間には歩行者全員。このプロセスを繰り返すことで、任意の長さの動作のシミュレーションが可能になります。

拡散モデルのノイズ除去ネットワークの設計では、人間の動きの物理的知識を拡散モデルに統合するために、元の社会力モデルに基づいてニューラル ネットワーク モデルを構築し、その中心となる項と合計を置き換えました。終点の力は次の式で直接表すことができます。さらに、グラフネットワーク(GN)アルゴリズムを使用して、歩行者の状態から社会的勢力の予測までのプロセスを実現します。

さらに、歩行者のインタラクションは等変です。つまり、インタラクションは、歩行者で構成される粒子状システムの変換 (並進、回転など) と同じ変換を受けるか、変化しないままになります。このような物性を持たせるために、インタラクティブな情報は、一連の等変グラフ畳み込みネットワーク層 (EGCL) を通じて処理され、モデルのトレーニング効率と物理的一貫性が向上します。

最後に、各歩行者の履歴移動状態は、長期短期ニューラル ネットワーク (LSTM) を通じて処理されます。履歴処理モジュールの導入は、人間はエネルギーを節約するために移動状態をあまり変更しない傾向があるという事前の認識に起因しています。 。

拡散モデル用のパラメトリックノイズ除去ニューラル ネットワーク設計

物理的に一貫した長距離移動シミュレーションを実現するために、この研究ではマルチフレーム演繹トレーニング アルゴリズムをさらに設計しました。以下の図に示すように、拡散モデルはトレーニング中に定義された時間枠内で軌跡をシミュレートし、累積誤差を損失関数として計算して、勾配降下法でモデル パラメーターを更新します。この学習プロセスは、長距離シミュレーションでの物理的一貫性を無視するモデルの近視眼的な動作にペナルティを与え、モデルが長距離シミュレーションで一般化を達成できるようにします。

提案されたマルチフレーム演繹トレーニング アルゴリズムの概略図

実験結果: 最適なパフォーマンスを達成するには、5% トレーニング データのみが必要です

このモデルの有効性を評価するには、この研究では、GC データと UCY データセットという 2 つの現実世界のデータセットを導入します。これら 2 つのデータセットは、シーン、規模、継続時間、歩行者密度が異なり、モデルの一般化パフォーマンスを検証するために使用できます。

この研究では、ベースライン手法を次の 3 つのカテゴリに分類しました。

※物理ベースの手法(ソーシャルフォースモデルSFM、セルラーオートマタCA)

* 純粋なデータ駆動型メソッド (STGCNN、PECNet、MID) 

※物理知識融合法(PCS、NSP)

比較実験により、最先端のベースライン手法と比較して、提案された手法のパフォーマンスが大幅に向上していることが検証されます。マイクロ指標 (MAE、DTW) とマクロ シミュレーションの信頼性指標 (OT、MMD) の観点から見ると、改善範囲は 6% から 37% の範囲になります。

メイン実験 UCY データセットでのパフォーマンスの比較
太字の領域は最高のパフォーマンスを表し、下線付きの領域は 2 番目に優れたパフォーマンスを表します。

各時間枠でのシミュレーション精度のパフォーマンスをさらに調査するために、この実験ではシミュレーション時間枠に伴う指標の変化を調べます。時間の経過とともにインジケーターが上昇と下降を繰り返す振動的な変化、つまりマルチピーク現象が発生していることがわかります。増加は長距離シミュレーション中に蓄積された誤差に起因すると考えられ、減少は 3 つのモデルすべてが歩行者を終点まで「引っ張った」という事実に起因すると考えられます。

全体として、この記事で提案された方法は、他の 2 つのベースラインよりも長期間にわたって低い誤差を維持できます。これは、この方法のシミュレーションの精度を反映しています。

シミュレートされた時間枠でインジケーターがどのように変化するか

データセット UCY と GC を使用し、指標として OT と MMD を使用します

この研究では、この方法の各キー設計のパフォーマンス向上への貢献をさらに調査し、社会物理学的知識の融合なし、履歴処理モジュールなし、およびマルチニードル導出トレーニング アルゴリズムなしでのモデルのパフォーマンスをそれぞれ検証します。

以下の図の実験結果は、次のことを示しています。いずれか 1 つのコンポーネントを削除すると、モデルのパフォーマンスがある程度低下しますが、これは各設計セットの有効性を示します。社会物理学的ガイダンスに関連する設計が削除され、群集シミュレーションに社会物理学的知識を組み込む必要性が具体化されると、モデルのパフォーマンスが最大の損失を受けることに注意してください。

モデルのさまざまなモジュールのアブレーション実験、NC は収束しないことを意味します

最後に、この論文では、群集インタラクション モジュールの等変設計によって導入された誘導バイアスがパフォーマンスに及ぼす影響を研究します。等変グラフ畳み込み層を非等変ネットワークに縮退する場合、さまざまなトレーニング データ量とトレーニング サイクルの下でモデルのパフォーマンスの変化を調査します。図に示すように、等変グラフ ニューラル ネットワークを使用したモデルは、ほぼすべてのトレーニング サンプル比で非等変モデルを使用した場合よりも一貫して優れたパフォーマンスを発揮します。 5% のトレーニング データのみを使用しても、元のモデルは依然として優れたパフォーマンスを維持しています。

具体的には、トレーニング サンプル比が 5% の場合、SPDiff の MAE インデックスはトレーニング サンプル比 100% と比較してほとんど減少せず、最大の減少も 2.5% にすぎません。非等変設計と比較して、等変設計は MAE 指数を最大 13.2%、OT 指数を最大 22% 改善します。これは、等変設計のおかげで、この記事で提案したモデルは少数のサンプルを借用するだけで、大量のデータでトレーニングした後と同等の汎化能力を得ることができることを示しています。

異なるトレーニングサンプル比での MAE の変化

結論

本稿では、条件付きノイズ除去拡散モデルに基づく新しい歩行者移動シミュレーション手法を提案する。このモデルは、物理的に誘導された条件付き拡散プロセスを通じて、群衆の動きの既知の状態情報を効果的に使用して歩行者の動きをシミュレートできる。

有名な社会力モデルにインスピレーションを得て、提案された等変群衆インタラクション設計とマルチフレーム演繹トレーニング アルゴリズムは、マクロおよびミクロ シミュレーションの信頼性と長距離シミュレーションの安定性という課題をそれぞれ解決します。この方法では、人間の流れに関連する研究に生成モデリングを導入し、社会物理学的知識と生成ディープ モデルの組み合わせを探索します。

召喚命令

HyperAI は、科学のための AI に焦点を当てた最初のオープン コミュニティの 1 つであり、国内外の最先端の論文を解釈することで最新の研究結果を共有し、促進し続けています。

最新の研究結果を共有したり、詳細な解釈論文を提出したりするために、科学のための AI に関する研究と探索を行っている研究グループや研究チームからの連絡を歓迎します。AI4S を推進するためのさらなる方法が、私たちが一緒に探索するのを待っています。

WeChat を追加: Neurostar (WeChat ID: Hyperai01)