AI技術が私たちの日常生活に広く浸透するにつれ、モデルの「解釈可能性」は、徐々に解決すべき緊急の問題になってきました。特に人命や財産の安全などのタスクに関しては、この「ブラックボックス」アルゴリズムはAIシステムに対するユーザーの信頼を弱めるだけでなく、安全性や差別などの一連の問題を引き起こします。
この問題は、時系列予測タスクで特に顕著です。時系列予測には、株式市場の予測、病気の予測、エネルギー予測、天気予報などを含むがこれらに限定されない、複数の主要産業が関係します。これらの分野のタスクでは、AI の決定の背後にある理由を理解することが重要です。病気の予測を例にとると、医師と患者は AI の予測結果を知るだけでなく、その結果がどのように得られるのかを知る必要があります。どの症状が診断に重要な役割を果たしているかを明確に指摘できれば、医師の能力と能力が向上します。 AI 支援医療に対する患者の理解、医療診断への信頼。
時系列予測を単なる正確な数値ではなく「見える化」できるプロセスにするために、華中科技大学のLu Fengチームは、シドニー大学および同済病院のZomaya学者チームと協力して、新しい手法であるCGSマスクを提案した。この方法は、時系列予測と解釈可能性を組み合わせることで、モデルの予測精度を向上させ、予測結果をより直感的で解釈しやすくすることができます。
具体的には、マスク メカニズムを導入することにより、モデルは、運転中に道路上の重要な標識を明確にマークするのと同じように、どの瞬間とどのデータが最終結果に最も大きな影響を与えるかを強調表示することができ、特定の標識を作成する必要がある理由を理解できるようになります。あるいは意思決定を遅らせる。このアプローチは、医療、天文学、センサー、エネルギーなどの分野で幅広い応用の可能性があり、ユーザーとの対話が必要な時系列予測タスクではさらに重要です。
「CGS-Mask: Making Time Series Predictions Intuitive for All」と題されたこの結果は、世界トップの人工知能会議である第 38 回 AAAI Conference on Artificial Intelligence (AAAI'24) の議事録に出版が受理されました。
研究のハイライト:
* 従来の方法と比較して、CGS-Mask は、予測結果にとってどの期間が最も重要で、どの要素が重要ではないかをより明確に表示できるため、ユーザーは予測プロセスを理解しやすくなります。
* CGS-Mask は、さまざまな時系列予測タスク、特に株式市場の予測、病気の予測、天気予報など、ユーザーの対話と結果の解釈を必要とするシナリオに適しています。
* CGS-Mask は、精度、解釈可能性、直観性の点で他の方法よりも優れており、「ブラック ボックス」問題が軽減され、モデルの透明性が向上します。この方法により、専門家でなくてもモデルの予測結果を理解できるようになり、より使いやすくなり、モデルの適用性と信頼性が高まります。
* 将来的には、研究者らは CGS-Mask を積極的に強化し、より多くの時系列アプリケーション、特に医療分野での CGS-Mask の適用可能性を実証するために取り組む予定です。そこでは、医療記録から顕著な特徴を特定して明らかにするためにこの方法が使用されます。病気の発生、進行、悪化
用紙のアドレス:
https://ojs.aaai.org/index.php/AAAI/article/view/29325
公式アカウントをフォローし、バックグラウンドで「時系列予測」に返信すると全文PDFが入手できます
オープンソース プロジェクト「awesome-ai4s」は、100 を超える AI4S 論文の解釈をまとめ、大規模なデータ セットとツールを提供します。
https://github.com/hyperai/awesome-ai4s
研究者によって選択された 4 つの合成データ セットがあります。それは、「レアな特徴」、「レアな時間」、「混合」、そして「ランダム」です。
* まれな特徴とまれな時間データ セットには、それぞれ少数の重要な特徴と少数の重要な時点が含まれます。
※混合データセットは、希少な特徴と希少な時間を統合して作成されます
* ランダム データ セットの顕著な入力領域はランダムに配置されます
研究者によって選択された現実世界のデータセットは、MIMIC-III データセット、LSST データセット、NATOPS データセット、および AE データセットです。これらのデータセットは、ヘルスケア、天文学、センサー、エネルギーなどの分野をカバーしており、さまざまな分野で CGS-Mask のパフォーマンスを評価するために使用されます。
MIMIC-III データセット:40,000 人の集中治療室 (ICU) 患者の健康記録が含まれており、各患者には次の 48 時間以内の患者の生存率を予測するために使用される 31 の特徴があります。これは二項分類タスクであり、目的は患者が生きるか死ぬかを区別することです。
LSST データセット:天文時系列データをシミュレートして、大型シノプティックサーベイ望遠鏡による観測の準備をします。このデータを 14 の異なる天文学カテゴリに分類するには、予測モデルが必要です。
NATOPS データセット:ジェスチャ認識センサーによって生成され、手、肘、手首、親指からのセンサー データが記録されます。データは 6 つの異なるジェスチャに分類する必要があります。
AEデータセット:UCI リポジトリからの家庭用電化製品のエネルギー予測データ セット。住宅の総エネルギー使用量を予測するために使用されます。これは回帰タスクであり、予測モデルの出力は総エネルギー使用量を表す数値です。
CGS-Mask は、セルラー遺伝的ストリップ マスクに基づく顕著性手法であり、セルラー遺伝的アルゴリズムを組み合わせてバー マスクを最適化することで、時系列予測タスクにおける「ブラック ボックス」問題を解決できます。
* バー マスクは、連続するタイム ステップを全体として処理して特徴の影響を評価し、時系列データの時間依存性を効果的にキャプチャできます。バー マスクのバイナリ値 (0 または 1) により、結果の解釈可能性が向上します。有意性スコアがより直感的になります。
バー マスクを最適化するための具体的な手順は次のとおりです。まず、バー マスクのセットを作成し、それらをセル オートマトンにマッピングします。次に、交叉、突然変異、翻訳などの遺伝的操作を使用して各マスクを最適化します。コードは次世代に進化します。 ; N ラウンドの世代の後、最も高い適合度を持つマスクが最適なマスクとして選択されます。 CGS-Mask の全体的なフレームワークを次の図に示します。
初期化母集団 (母集団の初期化):バー マスクの母集団をランダムに初期化し、これらのマスクを 2 次元セル オートマトンにマッピングします。
フィットネス評価:各バー マスクの適合度値は、モデル予測に対するマスクの影響を測定する、定義された摂動誤差によって計算および評価されます。
遺伝的オペレーターの最適化: 交差、突然変異、翻訳などの遺伝的オペレーターを使用して各マスクを最適化します。
* クロスオーバー: アルゴリズムは、隣接するマスク間でクロスオーバー操作を実行して、新しいマスクを生成します。 CGS-Mask では、ストリップは遺伝的操作の基本単位です。新しくマスクされたストリップは、どちらの親からも継承できます。
*突然変異:マスク内のストリップを一定の確率で置き換えることによって遺伝的多様性を高め、アルゴリズムが局所的な最適解に早期に収束するのを防ぎます。
* 翻訳: タイムライン上のストリップの位置オフセットを調整して、バーマスクを最適化します。これは、ストリップの位置を微調整して、入力データ内の真の顕著な領域に正確に位置合わせするのに役立ちます。
反復的な進化:上記の遺伝的演算子を繰り返し適用することにより、集団内のマスクが進化し、より高い適応度値を持つマスクが見つかります。
最適なマスクを選択します。N ラウンドの反復の後、最も高い適合値を持つマスクが最適なマスク (最適マスク M*) として選択されます。
CGS-Mask は、セル オートマトンと遺伝的アルゴリズムを組み合わせてバー マスクを効率的に最適化し、時系列予測の明確で直感的な解釈を提供します。この方法はモデルの内部情報を必要としないため、さまざまなブラックボックスモデルに適しており、ユーザーに意味のある説明を迅速に提供できます。
CGS-Mask 手法のパフォーマンスを評価するために、研究者らは合成データセットと現実世界のデータセットに対して、CGS-Mask 手法を他の 8 つの最先端の顕著性手法と比較しました。これらの手法には、Dynamask、DeepLIFT、RISE、FIT、Shapley Value Sampling (SVS)、Feature Occlusion (FO)、Feature Permutation (FP)、Integrated Gradient (IG) が含まれます。以下の図に示すように、実験結果は、CGS-Mask が顕著な特徴を決定する際に高い精度を示し、時間の経過とともに変化する顕著な特徴を識別するのにより効果的であることを示しています。
医療および健康分野での応用を例に挙げると、研究者らは今後 48 時間の患者の生存率を予測するために MIMIC-III データセットを選択しました。さまざまな方法の比較を以下の図に示します。図 f は、CGS-Mask の予測結果を示しています。緑色のバーは、患者の転帰に関連する主要な特徴を示しています。この研究では、血圧の低下、頻脈、息切れはすべて、差し迫った死のリスクを示しており、医師はこれらの特徴に基づいてタイムリーに介入できることが判明しました。ただし、他の比較方法では、図 (a) ~ (d) に示すように、この結果につながる期間と特性が明確に特定されません。
生成されたマスクの読みやすさを評価するために、研究者らは、さまざまな年齢層 (5 ~ 83 歳) とさまざまなレベルのドメイン知識を持つ 254 人の参加者を調査しました。結果は次のようになります。65% ユーザー以上が CGS-Mask を、顕著な特徴とその時間的相関関係を理解するのに最も役立つ方法として評価し、85% ユーザー以上が CGS-Mask をトップ 3 にランク付けしました。
さらに、研究者らはパイロット ユーザー スタディを実施し、3 つの顕著性マスク (Q1、Q2、Q3) を使用して 10 時間ステップにわたる特徴重要度の応答時間と精度で 4 つの特徴 (A、B、C、D) のパフォーマンスを評価しました。以下の図に示すように、CGS マスク (Q2) を使用するユーザーの平均反応時間は 6.26 秒、精度は 85.4 % でしたが、数値マスク (Q1 および Q3) を使用するユーザーの平均反応時間は 19.22 秒、精度は 85.4 % でした。精度はわずか40.6%です。これは、CGS-Mask が、ユーザーが機能の重要性をより迅速かつ高精度に識別するのに役立つことを示しています。
要約すると、CGS-Mask はモデルに依存しない顕著性手法として、直感的で使いやすいだけでなく、時系列予測を効果的に説明できます。合成データと現実世界のデータの両方で既存のソリューションを上回るパフォーマンスを発揮します。特に医療分野では、CGS-Mask は医療記録の顕著な特徴を特定する優れた能力を実証しています。これは病気の発生、発症、悪化を明らかにする上で非常に重要であり、大きな応用可能性を秘めています。
時系列予測は、データの傾向、季節的パターン、周期的パターンを捉えるモデルを構築することを目的とした時系列データの分析です。これらのモデルは、過去のデータの変化を予測するだけでなく、将来の開発傾向を分析することもでき、金融、気象、医療、交通、エネルギー予測などの多くの分野をカバーしています。
医療分野では、この記事の筆頭著者である華中科技大学の Lu Feng 教授が、配列予測モデルの応用に引き続き注力しています。上記の研究に加えて、彼女はシドニー大学のチームと協力して、第 37 回 AAAI 人工知能会議 (AAAI'23) の議事録で論文「術中低血圧早期警告のための複合多注意フレームワーク」を発表しました。
原紙:
https://ojs.aaai.org/index.php/AAAI/article/view/26681
この論文では、研究者らは、マルチモダリティと注意メカニズムに基づいた術中低血圧のフォローアップ早期警告フレームワークを提案しています。 2 つの大規模な実際のデータセットでの実験では、この方法が信号サンプリング レートを 3,000 分の 1 に大幅に削減する必要がある一方で、術中低血圧イベントの早期警告に関して最大 94.1% の精度を達成できることが示されています。さらに、最も困難な 15 分間の平均動脈圧予測タスクでは、マルチモーダル フレームワークは平均絶対誤差 4.48 mmHg を達成し、既存のソリューションと比較して誤差が 42.9% 減少しました。
同様に、南京医科大学の研究チームも時系列モデルを開発しました。肝炎の発症を予測するために使用されます。彼らは、季節的自己回帰移動平均モデルと季節的指数平滑法モデルを使用して、さまざまな種類の肝炎の症例数を分析しました。
研究によると、毎年3月はさまざまな種類の肝炎のピークシーズンであることがわかっています。過去 10 年間、A 型肝炎の発生率は全体的に減少傾向を示していますが、B 型肝炎の発生率は近年増加し続けていますが、E 型肝炎の発生率は基本的に変化していません。安定させます。これらの発見は、より効果的な肝炎の予防および管理対策を開発するための重要な基礎を提供します。この研究は「2012年から2021年までの中国における4つの肝炎流行傾向の時系列分析と予測」と題され、南京医科大学ジャーナル(自然科学)に掲載された。
要約すると、医療分野における時系列予測テクノロジーの応用は、テクノロジーの継続的な進歩と豊富なデータの増加に伴い、将来的にはより革新的な時系列予測モデルと方法が登場することを期待しています。人類の健康と福祉にさらに貢献します。
参考文献:
https://mp.weixin.qq.com/s/8gYtFqcuctY0BqBYa1e_Hg
最後に、学術活動をお勧めします。イベントの詳細は画像をクリック↓