大気質の検出の問題に対応して、インド工科大学のチームは、携帯電話で写真を撮ることで大気質を学習し、霧の天気情報を効果的に把握できる AQI 推定モデルをクラウド上でトレーニングしました。
| インド工科大学 Prerna Khanna 他著
コンパイル済み | リトルウォルナット、ブラックウォルナットラボ
この記事は公開アカウントの許可を得て転載しています。」ブラックウォールナットラボ「ID: blackwanutlabs、著者と翻訳者の努力に感謝します!
咳の一種に「スモッグ咳」というものがあるのをご存知ですか? 「かすみ色」という色もあるんですね?長い間靄の中で格闘した後、誰もがなすすべもなく厄介な空気の質をからかっていました。
長年にわたって大気汚染に悩まされている北京、蘭州、成都などの国内都市に加え、インドのデリー、韓国のソウル、タイのチェンマイなどの海外都市も深刻な大気汚染問題に直面している。冬に。
冬の大気汚染により、人々は活動が制限されるだけでなく、健康被害にも悩まされています。メディアの報道によると、大気汚染は世界中で 880 万人の死亡の原因となっています。
世界的な大気汚染は深刻な問題であり、それを解決するための最初のステップは、人々が自分が吸う空気の質を監視できるようにすることです。
大気質の監視は汚染センサーを使用して実行できますが、大規模な導入には費用がかかります。インド工科大学の学生チームは、人々がスマートフォンで監視できる、信頼性が高く安価な大気質評価ソリューションを設計しました。
モバイルデバイスを使用した PM 2.5 の推定値
以前の研究では、機械学習がカメラ画像を効果的に利用して空気の質を評価できることが実証されていましたが、通常は一部の静的なカメラ画像に限定されていました。
インドの学生チームは、携帯電話で撮影した写真を通じて、Android ベースのモバイル アプリケーションで現地の大気質をリアルタイムで評価できるようにしたいと考えています。
彼らは、大気質評価の基準として、PM 2.5 およびそれより小さい直径の粒子を対象とすることを選択しました。結果を視覚化するために、PM 2.5 の予測を、政府が規定する標準スケールであるカラー グラデーション大気質指数 (AQI) テーブルにマッピングしました。その後、AQI 値に基づいて、対応する汚染警告が表示されます。
具体的な手順としては、アプリケーションが携帯電話のカメラから画像を収集し、Tensorflow Lite がデバイス上で画像を処理して AQI 予測値を提供するというものです。アプリケーションを開発する前に、クラウドで AQI 推定モデルをトレーニングしました。モデルは、Firebase ML Kit を使用して Android アプリケーションに自動的にダウンロードできます。
システムには次の部分が含まれています。
1. モバイル アプリ: 画像をキャプチャして AQI レベルを予測するために、アプリはデバイス上で画像を処理します。
2. TensorFlow Lite: トレーニングされたモデルを使用して予測を行うために使用され、それ自体は小さなバイナリ ファイルです (これは、帯域幅が制限されている場合のダウンロード速度にとって重要です)。
3. Firebase: 画像から抽出されたパラメータ (後述) が Firebase に送信されます。新しいユーザーがアプリを使用するたびに、そのユーザーに一意の ID が作成されます。これは、後でさまざまな地域に合わせて機械学習モデルをカスタマイズするために使用できます。
4. Amazon EC2: さまざまな地理的位置のパラメーターと PM 値を使用して、Amazon EC2 上でモデルをトレーニングします。
5. ML Kit: トレーニング済みモデルを ML Kit でホストし、自動的にデバイスにロードして、TensorFlow Lite を使用して実行します。
彼らは、ユーザーがアップロードした写真の特徴を使用して AQI を予測することと、スカイラインのない画像をフィルターで除外することという 2 つの画像ベースの機械学習モデルをトレーニングしました。
ユーザーの写真に基づいて、次の特徴を使用して AQI を予測します。 これらの特徴は、従来の画像処理技術を通じて抽出され、線形モデルを通じて結合されます。 2 番目のモデル (後述) は画像を直接使用します。
透過率: シーンの減衰と空気粒子からの反射後に携帯電話のカメラに入る光の量を表します。これは次の方程式で説明できます。
ここで、I は観察されたぼやけた画像、t はシーンからカメラへの透過率、J はシーンの放射輝度、A は空気の色ベクトルです。
ダーク チャネルの概念を利用して、すべての屋外画像の 1 つのカラー チャネルに強度がゼロまたは非常に低いピクセルが少なくともいくつかあると仮定して、単一のぼやけた画像の送信が判明しました。かすみのない画像 J の場合、ダーク チャネルは次のとおりです。
ここで、Jc は J のカラー チャネルの 1 つ、Ω(x) は x を中心とするローカル パッチです。エアライトは空または最も明るいエリアから推定できるため、透過率は次の式で取得できます。
ここで、Ic(y)/A は空気光 A によって正規化されたぼやけた画像であり、右側の第 2 項は正規化されたぼやけた画像の暗チャネルです。
空の色: 空が灰色の場合、その日は空気が汚染されていると考えられます。青は、RGB セグメンテーションを使用して推定できます。
空のグラデーション: 雲に覆われて空が灰色に見える場合があることを考慮してこの機能が組み込まれています。勾配は、空の領域のマスクを作成し、その領域のラプラシアンを計算することによって計算されます。
エントロピー、RMS コントラスト: これらの特徴は、画像に含まれる詳細を示します。悪天候の場合、画像の細部が失われます。 RMS コントラストは、画像のピクセル強度の標準偏差として定義されます。 RMS コントラストの式は次のとおりです。
ここで、Iij はサイズ M×N の画像の (i,j) ピクセルの明るさ、avg(I) は画像内のすべてのピクセルの平均明るさです。したがって、コントラストは PM 2.5 と反比例の関係にあります。エントロピーを推定するには、次の方程式を使用します。
ここで、pi はピクセル強度が i に等しい確率、M は画像の最大輝度です。 PM 濃度が増加すると、画像の細部が徐々に失われ、画像のエントロピーが減少します。したがって、PM2.5とは逆の関係にあります。
湿度: 研究では、PM 2.5 が湿気を吸収して視界を悪くするため、湿気の多い日には汚染レベルが上昇すると結論付けています。
ユーザーはアプリを使用して、家の中の AQI と家の外の AQI を予測できますか?
このモデルは、画像に少なくとも 50% のスカイラインが含まれている場合にその画像を予測でき、バイナリ分類子を使用してスカイライン画像を受け入れます。
彼らは転移学習を使用してこの分類器を作成し、TensorFlow Hub を使用してラベル付きデータセットでモデルを再トレーニングしました。データセットは 2 つのクラスで構成されます: 50% のスカイラインを含む 500 枚の画像、部屋、オフィス、庭園、屋外シーンなどを含む、スカイラインを含まない (または 50% 未満のスカイライン) 540 枚の画像。次に、MobileNet 0.50 アーキテクチャを使用して、未確認の 100 サンプルをテストしたときに 95% の精度が達成されました。その中で、TF for Poets はイメージの再トレーニングに役立ちます。
再トレーニングされたモデルの混同行列は次のとおりです。
左: スカイラインが 50% より大きい画像。スカイラインが 50% 未満の右の画像
スマートフォンごとにカメラの仕様が異なるため、ユーザーごとにカスタマイズされた機械学習モデルが必要になります。 このようなモデルをトレーニングするために、彼らは各ユーザーの画像を収集しました。
彼らは、画像ベースのモデルと気象パラメータを使用した時間モデルを組み合わせることにしました。気象パラメータを使用した時間モデルは、画像ベースの機械学習モデルをトレーニングする際に、より高い推論精度を取得してユーザーに結果を提供するのに役立ちます。また、画像ベースの機械学習モデルは、特定のユーザー向けにモデルをカスタマイズするのに役立ち、それによって予測を減らして推論精度を向上させます。エラー。
ユーザーごとに小さなトレーニング データセットを作成するために、トレーニング用に 7 枚の画像から特徴が抽出されました。画像は連続 7 日間にわたって撮影する必要があり、その半分は空を覆っており、太陽などの直接光源がありません。画像から特徴が抽出された後、それらは回帰モデルのトレーニングに使用されます。すべての画像特徴は PM 2.5 値に応じてほぼ線形にスケールされるため、モデルは線形です。
トレーニング データセットとモデルを作成した後、テスト用の 2 番目の画像セットが作成されます。データセットに 7 日間の 7 つの異なる画像特徴が含まれると、テストが開始されました。トレーニング RMSE が 5 日未満の場合、モデルはフリーズされて ML Kit に送信され、アプリケーションにダウンロードされます。 RMSE が 5 日以上の場合は、さらにトレーニング データを収集します。
画像の特徴とPM2.5の関係
推論の精度を向上させるために、気象データの時間モデル、最近の位置に基づく過去の AQI、画像モデルに基づく時間モデルの補足も利用して AQI を予測します。
研究チームは、2015 年から 2017 年にかけてインド政府の Web サイトからデリーの気象データセットを収集し、LASSO 最適化を使用してリッジ回帰を実行し、PM 2.5 レベルに影響を与える主要なパラメーターを選択しました。
選択される主要なパラメータは、過去 1 時間の PM 2.5 濃度、NO2、SO2、O3、露点などのさまざまなガスの濃度です。これらのデータは個別にトレーニングおよびテストされます。そのデータセットは 90% の精度を達成しました。
折れ線グラフは、21 日間にわたる 3 つのモデルによって与えられた RMS 誤差値を表します。
次の課題は、各ユーザーに対して適応型の画像ベースのモデルをホストすることです。これを行うために、彼らは Firebase ML Kit のソリューションを使用しました。これにより、カスタムおよび適応型 ML モデルをクラウドおよびデバイス上でホストできるようになります。
このシンプルだが効果的なシステムは、スモッグの検出または制御においてどこまで機能するのでしょうか?彼らのより深い探求と改善を楽しみにしましょう。