子どもたちのせせらぎから、青少年の果てしない考え、そして中年に至るまで、親や年長者の指示や懸念だけでなく、絶えず押し寄せる人生のプレッシャーもあります... 一瞬一瞬を注意深く考えるin life それぞれのステージでの経験や記憶には、さまざまな音がつきまといます。夏の蝉の鳴き声やバスケットボールコートの喧騒は青春であり、夕方のため息や携帯電話の通知音は成長です。耳をしっかりと塞いだり、ノイズキャンセリングヘッドフォンを着用したりしても、聴覚を完全に遮断することはできないのと同じように、音はあらゆる場所に存在します。
物理的な観点から見ると、音は物体の振動によって発生する音波であり、空気媒体を通って伝播するため、完全な真空環境でのみ分離できます。別の観点から見ると、言語の伝達手段としての音は、コミュニケーションのための重要な媒体であるだけでなく、感情の外在化のはけ口でもあります。 AIの活発な発展により、もともと空気中に存在していた音波がデータとして解析され、人体の健康状態を反映するようになりました。
近年、呼吸器内科、循環器内科、消化器内科などの分野で音声による疾患検出技術が登場し始めています。それに比べて、精神疾患の診断と治療における音声の応用は、半分心配、半分満足です。懸念されるのは、関連する音声データが大幅に欠如していることです(主に精神疾患の高いプライバシーが原因です)。嬉しいのは、音声に基づくオンライン状態診断により、患者が初期診断段階での恥ずかしさを軽減し、判断するのに役立つことです。できるだけ早く病気になるかどうか。
中国科学院の学者ルー・リン氏はインタビューで、2021年末の時点で国家データベースに660万人の重度精神障害患者が登録されていると述べた。治療を受けている人の数は20%を超えません。精神疾患の低治療率を解決するためには、音声解析に基づく診断法を積極的に拡充・推進することは大きな意義がある。
上海交通大学コンピューターサイエンス学部の准教授兼博士指導教員であるウー・メンユエ氏の研究グループは、精神疾患の診断と治療のための音声知能モデルを発表した。大規模な言語モデルに基づいて、医師と患者のさまざまな役割がシミュレートされ、人間の精神科診断医師の参加により、臨床基準を満たす世界初のオープンソースのうつ病相談会話データセットが構築されます。
ちょうど「国際女性デー」が近づく中、HyperAI はウー・メンユエ先生に詳しくインタビューする機会に恵まれ、音声の魅力と AI の素晴らしい反応について学びました。意志が強く自由な女性。興味から始めて、徐々にプロの分野で成果を上げる方法。
興味のあるところはどこでも、実行可能な研究を行うことを主張してください。
人の声道、口腔、鼻腔などには微妙な違いがあり、人の声紋は指紋や顔と同じように異なります。ウー・メンユエさんは、幼い頃から日常生活の中で「人の声を聞いてその人を認識する」という言葉の特殊性に非常に興味を持っており、それが彼女をオーディオの世界へ導くきっかけとなったと言えます。
学部生の頃、ウー・メンユエさんは非常に感受性が高く音に興味があり、北京師範大学で心理音響学を学びましたが、この期間に物理的な音響特性を使用して音の違いを技術レベルで説明することの重要性を認識しました。そして完成段階では音響データの分析にはコンピュータモデリングが選択されました。
学部時代に音響心理学の分野で音声分析研究を実施するという初期の試みがウー・メンユエの心に種を植えたとすれば、彼女が博士課程中に密接に関わった2つの関連研究プロジェクトがきっかけとなった。
博士課程の研究中、彼女のクラスメートの一人は統合失調症患者の音声分析研究を行っていましたが、フィールドワーク中に、彼女は臨床心理学の博士号を取得して卒業した後、メルボルンの刑務所に入った多数の統合失調症のホームレスの人々と接触しました。受刑者は、関連する犯罪行為が精神疾患の影響を受けているかどうかを説明するために精神鑑定を受けます。
これら 2 人のクラスメートの経験は、ウー メンユエに深いインスピレーションと影響を与え、中国に帰国後、精神疾患の診断と治療についてさらに詳細な研究を始めました。
彼女は言いました、音声学の分野において、音声や言語は、実は人間の脳機能の外面的な現れであるため、感情障害にせよ、認知機能障害にせよ、最終的には音声や言語の表現に手がかりを残します。言い換えれば、関連するバイオマーカーを音声から見つけて、精神障害または感情障害を持つ人々を効果的かつ便利にスクリーニングすることができます。
ある意味、人々が治療を受けるかどうか、どのように治療を受けるか迷っているとき、音声分析は精神疾患の診断における最初のチェックリストとなり、患者の恥の意識をある程度弱めることができる。
ずっと、呉夢月氏が主張するのは「実行すべき研究」だ。博士課程卒業後、Wu Mengyue 氏は AI 音声認識会社 Nuance Communications からの招待を受け、コックピットにおける人間とコンピューターのインタラクションの技術研究と産業側での実装に従事しようとしました。その後、上海交通大学コンピュータ理工学部の教授であるユウ・カイ氏との会話の中で、彼女は大学における科学研究の利点と、ユウ・カイ教授の経験を通じて結果を変革するための新しいアイデアを理解して帰国した。産業界から学界まで。
呉夢月は率直にこう言った。大学でも産業界でも、「実践的な研究をする」という初心は変わりません。流行中、研究チームは実際のニーズに基づいて、学生が直接使用できる実用的なうつ病相談アプリを開発した。
音声分析を強化し、データ不足の問題を克服します
大学に戻った後も、Wu Mengyue 氏は音声分析の研究方向を選択し、そこにさらに AI テクノロジーを統合しました。現在、彼の研究グループの主な研究方向はリッチオーディオ分析です。これは平たく言えば、音声認識を除くすべてのオーディオ処理を指します。
Wu Mengyue 氏は、音は 3 つのレベルに分類できると紹介しました。一つは、人々が言ったことです。これが音声認識研究の焦点です。2つ目は人々の話し方です。つまり、同じ文をさまざまな方法で表現し、その背後に異なる意味を持たせることができ、それを利用して人の精神状態や認知機能を検出することができます。3つ目は環境音響への理解です。これは、音声を理解するという点で、機械をより人間らしくするための鍵でもあります。上記は豊富な音声分析を構成しますが、その中で音声認識は現在比較的成熟しているため、彼女の研究は後者の 2 つに焦点を当てています。
現在、Wu Mengyue の研究グループには 20 名を超える学生がおり、計算論的精神医学と音声理解における病理学的音声研究という 2 つの方向を中心に関連研究を行っています。
運転環境などのアプリケーション シナリオで具体的に言えば、音声認識とは、対話型システムが指示を受動的に認識し、対応する制御を実行することを意味します。アクティブなインタラクションが実現できれば、ドライバーの声の調子からドライバーの気分や疲労を判断し、それを機械が感知したときに車内の照明や効果音によって気分を調整することができます。ユーザーの声の調子が良くない場合でも、指示に応答するときに戦略やアイデアを同期的に調整できます。
別の例として、流行中にマイクを使用してドアの開閉などの周囲の音を収集し、外出/在宅状況を分析および判断しました。この方法は、従来のカメラ監視と比較して、個人のプライバシーの確保に役立ちます。そしてセキュリティ。
音声データはサンプル サイズが大きく、非常に豊富である必要があるという印象がもともとありますが、病気の診断と治療、特に精神疾患の分野では、データが大きな課題となっています。一方で、医師と患者の間のプライバシーの関係と患者の恥ずかしさのせいで、心理相談の会話音声を入手することは非常に困難です。他方では、一部の病院や医師は会話の形で相談を録音する場合がありますが、録音することはできません。作成された標準データは、音質が高くないことが多く、プライバシー保護のため、外部に共有することができないことがよくあります。
この目的を達成するために、Wu Mengyue 氏は研究チームを率いて、臨床基準を満たす世界初のオープンソースのうつ病相談会話データセットを構築しました。まず、精神保健センターの医師や患者との長期にわたる綿密なコミュニケーションを通じて、相談プロセスや対話の要点を蓄積し、関連する内容をデシジョンツリー構造の対話プロセスに整理します。専門の医師と一緒に調整を繰り返します。次に、医師と患者の対話をロールプレイングによってシミュレーションし、最終的に得られたデータを専門の医師にスクリーニングしてもらい、より臨床相談に近いデータを取得したのがこのオープンソースデータセットです。
データセットのリンク:https://x-lance.github.io/D4/
科学のための AI 研究に携わる他の学者と同様に、Wu Mengyue は心理学とコンピューターにおける学際的な背景により、現在の患者の実際の問題点に対処するだけでなく、AI を活用した精神疾患の診断と治療を促進しながら研究の課題にも対処することができます。 . シミュレーションデータの形で研究戦略を柔軟に調整します。学際的な背景は、多くの場合、科学研究においてより創造的なブレークスルーにつながる可能性があります。
興味を原動力にすれば、大きな成果を上げることができます
ウー・メンユエ氏とのインタビューの中で、著者は「興味」という言葉を何度か聞いた。オーディオ研究に焦点を当てるのは興味に基づくものであり、精神疾患の診断に関連する研究に興味を持つことは、トレンドに従うことではない。 、でも自分の興味を優先するのも研究グループの学生への配慮です。
厳密な学術研究であっても、ペースの速い職場の仕事であっても、「興味」はより多くの栄養を含む土壌であることは否定できません。呉夢月さんは、自分の興味をベースにしながらも、論文発表の頻度という点での科学研究の蓄積や、産業と研究の融合における実践的な応用など、「仏教」にもかかわらず手を抜いていません。 「実行できる研究を行う」ことを実践するのに強力です。
近年、科学技術や科学研究の分野で活躍する女性が増え、世界を驚かせる革新的なイノベーションをもたらしており、国連女性事務所も今年の国際女性デーのテーマを「投資」に設定しています。女性: 進歩の加速」では、社会プロセスにおける女性の重要な役割をある程度強調しています。
著者は性差をあまり強調したくないが、現実の社会環境においては圧力が存在する。しかし、ウー・メンユエが言ったように、「私たちは幸福に焦点を当て、利益から始めるべきです。」特に外の世界が女性に大きな期待を寄せていないということは、実は制約が少ないということであり、力を蓄えて爆発する機会を選ぶ成長の余地があるのかもしれない。
最後に、この特別な祝日に、すべての女性が自分の興味に向かって成長し、自信を持って栄養を摂取し、ウー・メンユエ先生のように、よりエキサイティングで自由な人生を開花できることを願っています。