2ヶ月前

時間領域の埋め込みを用いた連続型なりすまし対策自動話者認証

Weizman, Avishai ; Ben-Shimol, Yehuda ; Lapidot, Itshak
時間領域の埋め込みを用いた連続型なりすまし対策自動話者認証
要約

なりすましに強い自動話者認証(SASV)システムは、なりすまし音声からの保護において重要な技術です。本研究では、論理アクセス攻撃に焦点を当て、SASVタスク向けの新規アプローチを紹介します。時間領域における波形振幅の確率質量関数(Probability Mass Function: PMF)に基づく真偽の音声表現が用いられます。この手法は、訓練セット内の選択されたグループのPMFから導き出される新規な時間埋め込みを生成します。本論文では、性別分離の役割とその性能向上への肯定的な影響について強調しています。私たちは、なりすまし音声と真の音声のPMFから導かれる時間領域埋め込みと、男性および女性の時間ベース埋め込みによる性別認識を用いた対策(Countermeasure: CM)システムを提案します。この方法は顕著な性別認識能力を持ち、男性と女性それぞれで0.94%と1.79%の不一致率を達成しました。男性および女性CMシステムは、それぞれ8.67%と10.12%の同等誤差率(Equal Error Rate: EER)を達成しています。従来の話者認証システムとこのアプローチを統合することで、ASVspoof2019チャレンジデータベースを使用して改善された汎化能力と連携検出コスト関数評価を示しています。さらに、時間埋め込みアプローチと従来のCMとの融合がSASVアーキテクチャにおける汎化能力向上にどのように寄与するかについて調査しています。

時間領域の埋め込みを用いた連続型なりすまし対策自動話者認証 | 最新論文 | HyperAI超神経