HyperAI초신경

스마트폰을 공기질 모니터로도 사용할 수 있나요? 여러 공과대생의 가이드

特色图像

대기 질 감지 문제를 해결하기 위해 인도 공과대학교의 한 팀은 클라우드에서 AQI 추정 모델을 훈련했습니다. 휴대폰으로 사진을 찍으면 사용자는 대기 질에 대한 정보를 얻을 수 있고, 스모그 날씨에 대한 정보를 효과적으로 얻을 수 있습니다.

Prerna Khanna 외, 인도 공과대학교 작성

편집 | 리틀 월넛, 블랙 월넛 연구소

본 기사는 공식 계정 "에서 재생산이 허가되었습니다.블랙 월넛 연구소"ID: blackwanutlabs, 저자와 번역자에게 감사드립니다!

"스모그 기침"이라는 기침이 있다는 걸 알고 계셨나요? "헤이즈 컬러"라는 색깔도 있나요? 오랫동안 스모그에 시달리면서, 모두가 귀찮은 대기 질을 어쩔 수 없이 비웃고 있습니다. 

수년째 대기 오염으로 어려움을 겪고 있는 중국의 베이징, 란저우, 청두 등의 도시 외에도 인도의 델리, 한국의 서울, 태국의 치앙마이 등의 외국 도시들도 특히 겨울철에 심각한 대기 오염 문제에 직면해 있습니다. 

겨울에는 대기 오염으로 인해 사람들의 활동이 제한될 뿐만 아니라 건강 문제도 겪게 됩니다. 언론 보도에 따르면, 대기 오염으로 인해 전 세계적으로 880만 명이 사망했습니다. 

세계의 대기 오염 문제는 심각하며, 이를 해결하기 위한 첫 번째 단계는 사람들이 호흡하는 공기의 질을 모니터링할 수 있도록 하는 것입니다. 

오염 센서를 이용해 공기 질을 모니터링할 수는 있지만, 대규모로 배치하면 비용이 많이 듭니다. 인도 공과대학교의 학생 팀은 사람들이 스마트폰을 사용하여 모니터링할 수 있는, 공기 질을 평가하는 안정적이고 저렴한 솔루션을 설계했습니다. 

모바일 기기를 활용한 PM 2.5 추정

​모바일폰 사진 기반 실시간 공기질 분석

이전 연구에서는 머신 러닝이 카메라 이미지를 사용하여 공기 질을 효과적으로 평가할 수 있다는 점이 입증되었지만, 일반적으로 몇 대의 정적 카메라 이미지에 국한되었습니다. 

인도의 학생 팀은 휴대전화로 촬영한 이미지를 활용해 안드로이드 기반 모바일 앱에서 지역별 실시간 대기 질 평가 결과를 제공하고자 합니다. 

그들은 대기 질 평가 기준으로 PM 2.5와 그보다 작은 직경의 입자를 선택했습니다. 결과를 시각화하기 위해 PM 2.5 예측을 색상 그라데이션 대기 질 지수(AQI) 표에 매핑했습니다. AQI는 전 세계 정부에서 규정한 표준 척도입니다. 그러면 AQI 값에 따라 해당 오염 경고가 표시됩니다. 

TensorFlow Lite를 사용하여 대기 질 예측 

구체적으로, 앱은 휴대폰 카메라에서 이미지를 수집하고 Tensorflow Lite는 이를 장치에서 처리하여 AQI 예측을 제공합니다. 앱을 개발하기 전에 그들은 클라우드에서 AQI 추정 모델을 훈련했습니다. Firebase ML Kit을 사용하면 이 모델을 Android 애플리케이션에 자동으로 다운로드할 수 있습니다. 

이 시스템은 다음과 같은 부분으로 구성되어 있습니다. 

1. 모바일 애플리케이션: 이미지를 촬영하고 AQI 수준을 예측하는 데 사용되며, 애플리케이션은 장치에서 이미지를 처리합니다. 

2. TensorFlow Lite: 학습된 모델을 사용하여 예측을 수행하는 데 사용되며, 그 자체가 매우 작은 바이너리 파일입니다(대역폭이 제한될 때 다운로드 속도에 중요함). 

3. Firebase: 이미지에서 추출된 매개변수(아래 설명)가 Firebase로 전송됩니다. 새로운 사용자가 앱을 사용할 때마다 고유한 ID가 생성됩니다. 이는 나중에 다양한 지리적 위치에 맞게 머신 러닝 모델을 사용자 지정하는 데 사용될 수 있습니다. 

4. Amazon EC2: 이 모델은 다양한 지리적 위치 매개변수와 PM 값을 사용하여 Amazon EC2에서 학습되었습니다. 

5. ML Kit: 훈련된 모델은 ML Kit에 호스팅되고 자동으로 장치에 로드된 다음 TensorFlow Lite를 사용하여 실행됩니다. 

두 가지 모델 

그들은 두 가지 이미지 기반 머신 러닝 모델을 훈련시켰습니다. 하나는 사용자가 업로드한 사진의 특징을 사용하여 AQI를 예측하는 모델이고, 다른 하나는 스카이라인이 없는 이미지를 필터링하는 모델입니다.

AQI 모델 

그들은 사용자 사진을 기반으로 다음과 같은 특징을 사용하여 AQI를 예측했습니다. 이러한 특징은 기존의 이미지 처리 기술을 통해 추출되었고 선형 모델에 의해 결합되었습니다. 두 번째 모델(나중에 설명)은 이미지를 직접 사용합니다. 

투과율: 장면 감쇠와 공기 입자의 반사 후 휴대폰 카메라에 들어오는 빛의 양을 설명합니다. 이는 다음 방정식으로 설명할 수 있습니다. 

여기서 I는 관찰된 흐릿한 이미지이고, t는 장면에서 카메라로의 투과율이며, J는 장면의 광도이고, A는 공기 색상 벡터입니다. 

어두운 채널의 개념을 사용하여 모든 실외 이미지에서 하나의 색상 채널에 적어도 0 또는 매우 낮은 강도를 갖는 픽셀이 몇 개 있다고 가정하여 흐릿한 단일 이미지의 투과율을 찾습니다. 안개 없는 이미지 J의 경우, 암부 채널은 다음과 같습니다. 

여기서 Jc는 J의 색상 채널 중 하나이고 Ω(x)는 x를 중심으로 하는 로컬 패치입니다. 공기광은 하늘이나 가장 밝은 영역에서 추정할 수 있으므로 투과율은 다음과 같이 얻을 수 있습니다. 

여기서 Ic(y)/A는 공기 빛 A에 의해 정규화된 흐릿한 이미지이고, 오른쪽의 두 번째 항은 정규화된 흐릿한 이미지의 어두운 채널입니다. 

하늘의 색상: 하늘이 회색이면 공기가 오염된 날이라고 생각합니다. 파란색은 RGB 분할을 사용하여 추정할 수 있습니다. 

하늘의 기울기: 구름 덮개로 인해 하늘이 회색으로 보일 수 있다는 점을 고려하여 이 기능이 통합되었습니다. 기울기는 하늘 영역의 마스크를 만든 다음 이 영역의 라플라시안을 계산하여 계산됩니다. 

엔트로피, RMS 대비: 이러한 특징은 이미지에 포함된 세부 정보를 나타냅니다. 날씨가 오염되면 사진의 세부 정보가 손실됩니다. RMS 대비는 이미지 픽셀 강도의 표준 편차로 정의됩니다. RMS 대비에 대한 방정식은 다음과 같습니다. 

여기서 Iij는 크기가 M×N인 이미지의 (i, j) 픽셀의 밝기이고, avg(I)는 이미지의 모든 픽셀의 평균 밝기입니다. 따라서 대비율은 PM2.5에 반비례합니다. 엔트로피를 추정하려면 다음 방정식을 사용합니다. 

여기서 pi는 픽셀의 강도가 i와 같을 확률이고, M은 이미지의 최대 밝기입니다. PM 농도가 증가함에 따라 이미지의 세부 사항은 점차 사라지고 이미지 엔트로피는 감소합니다. 따라서 PM2.5와는 반비례 관계를 갖는다. 

습도: 연구에 따르면 습도가 높은 날에는 PM 2.5가 수분을 흡수하고 시야를 가리기 때문에 오염 수준이 높아진다고 합니다.

스카이라인 모델 

사용자는 앱을 사용하여 집 밖의 AQI를 예측하는 것처럼 방 안의 AQI를 예측할 수 있습니까? 

이 모델은 스카이라인의 50% 이상을 포함하는 이미지를 예측할 수 있으며, 이진 분류기를 사용하여 스카이라인 이미지를 수용합니다. 

그들은 전이 학습을 사용하여 이 분류기를 만들었고 TensorFlow Hub를 사용하여 레이블이 지정된 데이터 세트에서 모델을 다시 학습했습니다. 데이터 세트는 2개의 클래스로 구성됩니다. 스카이라인이 50%인 500개 이미지와 스카이라인이 없는(또는 스카이라인이 50% 미만인) 540개 이미지로, 여기에는 방, 사무실, 정원, 야외 풍경 등이 포함됩니다. 그런 다음 MobileNet 0.50 아키텍처를 사용하여 보이지 않는 100개 샘플에 대해 테스트했을 때 95%의 정확도를 달성했습니다. 이 중 TF for Poets는 이미지 재교육에 대한 지원을 제공합니다. 

재학습된 모델의 혼동 행렬은 다음과 같습니다. 

  왼쪽: 스카이라인이 50%보다 큰 이미지입니다. 오른쪽 이미지의 스카이라인은 50% 미만입니다.

사용자 정의 모델 

모든 스마트폰의 카메라 사양이 다르기 때문에 각 사용자에게는 맞춤형 머신 러닝 모델이 필요합니다. 이러한 모델을 훈련하기 위해 그들은 각 사용자의 이미지를 수집했습니다. 

그들은 기상 매개변수를 사용하는 시간 모델과 이미지 기반 모델을 결합하기로 결정했습니다. 기상 매개변수의 시간 모델을 사용하면 추론 정확도를 높이는 데 도움이 되며, 이미지 기반 머신 러닝 모델을 학습할 때 사용자에게 일부 결과를 제공하여 특정 사용자에 맞게 모델을 사용자 지정할 수 있으므로 예측 오류가 줄어들어 추론 정확도가 향상됩니다. 

각 사용자를 위한 소규모의 훈련 데이터 세트를 만들기 위해, 그들은 훈련을 위해 7개의 이미지에서 특징을 추출했습니다. 이미지는 7일 연속으로 촬영해야 하며, 이미지의 절반은 하늘을 덮고 태양과 같은 직사광선을 피해야 합니다. 이미지에서 특징을 추출한 후, 이를 사용하여 회귀 모델을 훈련합니다. 이 모델은 모든 이미지 특징이 PM 2.5 값에 거의 선형적으로 비례하기 때문에 선형적입니다. 

훈련 데이터 세트와 모델을 만든 후 테스트를 위해 두 번째 이미지 세트를 만듭니다. 데이터 세트에 7일 동안의 다양한 이미지 특징이 포함되자 테스트가 시작되었습니다. 학습 RMSE가 5일 미만이면 모델은 동결되고 ML Kit으로 전송되어 앱에서 다운로드됩니다. RMSE가 5일 이상인 경우, 추가 학습 데이터를 수집합니다. 

이미지 특징과 PM 2.5의 관계

기상 매개변수 

추론 정확도를 높이기 위해 그들은 기상 데이터의 시간 모델을 사용하여 최근 위치의 과거 AQI를 기반으로 AQI를 예측했으며, 이미지 기반 모델로 시간 모델을 보완했습니다. 

연구팀은 2015년부터 2017년까지 인도 정부 웹사이트에서 델리의 기상 데이터 세트를 수집하고 LASSO 최적화를 사용한 능형 회귀 분석을 수행하여 PM 2.5 수준에 영향을 미치는 주요 매개변수를 선택했습니다. 

선택된 주요 매개변수는 다음과 같습니다. 지난 1시간 동안의 PM 2.5 농도, NO2, SO2, O3와 같은 다양한 가스의 농도, 이슬점. 그런 다음 각각 데이터를 훈련하고 테스트합니다. 해당 데이터 세트의 정확도는 90%에 도달했습니다. 

선 그래프는 21일 기간 동안 세 가지 모델이 제공한 RMS 오차 값을 보여줍니다. 

다음 과제는 각 사용자에 대한 적응형 이미지 기반 모델을 호스팅하는 것입니다. 이를 위해 Firebase ML Kit의 솔루션을 사용했습니다. 사용자 정의 및 적응형 ML 모델을 클라우드와 디바이스에 호스팅할 수 있습니다. 

이 간단하면서도 효과적인 시스템은 스모그를 감지하거나 통제하는 데 얼마나 효과적일 수 있을까? 그들의 더욱 심도 있는 탐구와 개선을 기대해 주시기 바랍니다!