
要約
発話者識別情報の除去(speaker de-identification)は、発話の理解可能性を維持しつつ、発話者の個人情報を隠匿することを目的としている。本研究では、三つの補完的な誤差率を用いて残存する識別情報漏洩を定量評価するベンチマークを提案する。これらは、等誤差率(equal error rate)、累積マッチ特性(cumulative match characteristic: CMC)のヒット率、および正準相関分析(canonical correlation analysis)およびプロクラステス分析(Procrustes analysis)を用いた埋め込み空間内での類似度である。評価結果から、最先端の発話者識別情報除去システムすべてが、識別情報の漏洩を引き起こしていることが明らかになった。本研究で評価した中で最も性能の高いシステムでも、ランダム推測よりもわずかに優れるにとどまり、最も性能が低いシステムでは、トップ50の候補の中でのヒット率が45%に達した。これらの結果は、現在の発話者識別情報除去技術に依然として深刻なプライバシー上のリスクが存在することを示している。