韓国では1週間で新たに1,000人の感染者が確認されており、AIを使って咳をしている人の位置を特定したいと考えている

新型コロナウイルス感染症の世界的な感染拡大傾向は依然として改善されていない。韓国ではここ数日回復が見られ、過去7日間で合計1,576人の新規感染者が発生し、今日の新規感染者は288人となった。韓国科学技術院のチームは、新型コロナウイルス肺炎患者の早期発見に役立つディープラーニングに基づく咳認識モデルを開発した。
今年は、新型コロナウイルス感染症(COVID-19)の予防と制御の必要性により、非接触検査技術が迅速に導入されました。額式体温計銃、耳式体温計銃、AI赤外線体温計など、さまざまな体温計銃を見たことがあるでしょう。
発熱に加えて、咳も新型コロナウイルス感染症の主な症状の 1 つです。しかし、現時点では咳を非接触で検査する方法はありません。
最近、韓国科学技術院(KAIST)の研究チームが開発した新型コロナウイルス感染症の疑いのある症例をタイムリーに検出するためのディープラーニング手法に基づく咳認識モデル。
韓国では感染が再燃しており、過去1週間で新たな感染者が1,000人以上報告されている
2020年も半分以上が過ぎた今、新型コロナウイルスは終息する気配がないようで、世界中で毎日何十万人もの新たな診断が下されています。最近、韓国、ドイツ、日本、その他の国での感染状況が回復しています。
報道によると、韓国では8月14日から20日までの1日で合計1,576人の新規感染者が報告され、7日間で合計1,576人の感染者が確認され、20日だけで288人の新規感染者が発生した。

韓国では教会、レストラン、学校などの公共の場所での感染リスクが高まっている。韓国は再び緊迫した防疫戦争に直面することになり、現在各地で抑制策が強化されている。
「早期発見」は流行の予防と制御の第一歩です。この点について、韓国科学技術アカデミーの研究チームは次のように考えています。現在、非接触型の体温検出ツールは比較的充実していますが、咳症状についてはそのような検出方法がありません。
新型コロナウイルス感染症患者を適時に検出し、医療スタッフの負担を軽減するために、韓国科学技術研究院機械工学科のパク・ヨンファ教授のチームは、深層学習に基づく咳認識モデルは、咳の音をリアルタイムで分類するために開発されました。

研究チームは、咳認識モデルが、混雑した公共の場所で感染症の蔓延を検出したり、病院でいつでも患者の状態を監視したりするための医療機器として使用されることを期待している。
咳をしているのは誰ですか?このモデルは一度聞いたら間違いありません。
この咳分類モデルはカメラと組み合わせられており、公共の場所での咳、咳をしている人の位置、咳の回数を特定し、リアルタイムに可視化します。
研究チームは次のように述べています。彼らの最良のテストでは 87.4% の精度が達成されました。

この咳認識モデルを開発するには、パク教授のチームは畳み込みニューラルネットワーク(CNN)を使って教師あり学習を実施した。
この方法では、複数のレイヤーのデータ フィルタリングを通じて特徴を抽出し、最も近い値を導き出します。彼らは「オーディオ セット」をトレーニングおよび評価データとして使用しました。「オーディオ セット」は、Google と YouTube が研究のために使用するオープンなオーディオ データ セットです。
このモデルは最終的に、1 秒間の音声プロファイル特徴を入力することによって二値分類を実行し、咳イベントまたはその他の出力結果を生成します。
具体的な調査プロセスは次の 3 つの部分に分かれています。
ステップ 1: データセットを収集する
トレーニングと評価の際、チームは、Audioset、DEMAND、ETSI、TIMIT からさまざまなデータセットを収集しました。
彼らはオーディオセットから咳やその他の音を抽出し、データセットの残りの部分をデータ拡張のための背景ノイズとして使用して、モデルをさまざまな背景ノイズのある公共の場所に一般化できるようにしました。
咳認識モデルがさまざまな背景雑音を学習できるようにするため、研究者らは背景雑音を「音声セット」に15%~75%の割合で混ぜ、音量を0.25~1.0倍に調整することでコンピュータを訓練した。
ステップ 2: モデルの最適化と組み合わせたトレーニング
ネットワーク モデルの最適化プロセス中に、Park 教授のチームは 7 つのオプティマイザーを使用しました。スペクトログラム、メルスケール スペクトログラム、メル周波数ケプストラム係数を含む 5 つの音響特徴のさまざまな組み合わせがトレーニングされました。

次に、音響特徴としてメル スケール スペクトログラム、オプティマイザとして ASGD を使用し、最大 87.4% のテスト精度で、各組み合わせのパフォーマンスをテスト データ セットと比較しました。
ステップ 3: オーディオ カメラとビデオ カメラを組み合わせてリアルタイム トラッキングを実現する
トレーニングされた咳認識モデルをオーディオおよびビデオ カメラと組み合わせます。

このカメラは、マイク アレイとカメラ モジュールで構成され、収集された一連の音響データに対してビームフォーミング処理を実行して、入ってくる音源の方向を決定します。
次に、咳認識モデルは、その音が咳であるかどうかを判断します。その場合、咳の位置がビデオ画像として視覚化され、ビデオ画像内の咳音源の位置に「咳」のラベルが付けられます。

研究チームが発見したのは、騒がしい環境でも、このモデルは咳やその他の音を識別することに成功しました。
病院や教室などの環境でトレーニングをさらに実施すれば、精度はさらに高くなります。この技術は現在、韓国のエネルギー技術部門によってサポートされています。
パク教授は、「新型コロナウイルス感染症(COVID-19)のような大流行の下では、咳検知カメラは公共の場所での流行の予防と早期発見に役立つ可能性がある」と述べた。特に病棟に適用すると、患者の状態を24時間把握できるため、医療スタッフの負担を軽減しながら、より正確な診断をサポートします。 」

ただし、発熱の基準は明確で、体温が37.3℃を超えれば発熱とみなします。
しかし、咳にはさまざまな種類があり、空咳、湿咳、風寒咳、風熱咳、喉をすっきりさせる咳、雰囲気を和らげるための厄介な咳などがあります...
このモデルをさらに研究して、さまざまなタイプの咳を判定したり、体温測定と組み合わせたりできることが期待されています。結局のところ、健康な人でも咳をすることはあります。

参考文献:
- 以上 -