2ヶ月前
ByteCover3: 短いクエリにおける正確なカバーソング識別
Xingjian Du; Zijie Wang; Xia Liang; Huidong Liang; Bilei Zhu; Zejun Ma

要約
近年、ディープラーニングを基盤とする手法がカバーソング識別(CSI)のパラダイムとなっています。ByteCoverシステムは、CSIの主要データセットにおいて最先端の成果を達成しています。しかし、短編動画の増加に伴い、多くの実世界アプリケーションでデータベースのフルレングス音楽トラックと短い音楽断片をマッチングする必要が生じており、この分野はまだ十分に研究されておらず、産業レベルの解決策が待望されています。本論文では、前バージョンのByteCoverシステムをローカル特徴量を利用することで短い音楽クエリの識別性能をさらに向上させるByteCover3へとアップグレードしました。ByteCover3はローカルアライメント損失(LAL)モジュールと二段階特徴量検索パイプラインを備えており、システムがより正確かつ効率的にCSIを行うことが可能となっています。私たちは異なるベンチマーク設定を持つ複数のデータセットでByteCover3を評価し、その結果ByteCover3は比較対象となった全ての方法(含む以前のバージョン)を上回りました。