HyperAIHyperAI

Command Palette

Search for a command to run...

サッカー動作検出の改善:音声と映像ストリームの両方を使用して

Bastien Vanderplaetse Stéphane Dupont

概要

本論文では、サッカー映像における多モーダル(音声と映像)アクションスポットティングおよび分類に関する研究を提案します。アクションスポットティングおよび分類は、映像内のイベントの時間的な基準点を見つけることと、それがどのイベントであるかを決定することを目的としたタスクです。これは一般的な活動理解の重要な応用例です。本研究では、深層ニューラルネットワークアーキテクチャの異なる段階で音声情報と映像情報を組み合わせる実験的研究を提案します。SoccerNetベンチマークデータセットを使用しました。このデータセットには、ビッグファイブヨーロッパリーグから500試合のサッカー映像の注釈付きイベントが含まれています。本研究を通じて、音声ストリームを映像のみに基づくアーキテクチャに統合するいくつかの方法を評価しました。その結果、アクション分類タスクにおいて平均精度(mean Average Precision: mAP)メトリックで平均絶対改善率7.43%、アクションスポットティングタスクにおいて4.19%の改善が観察されました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
サッカー動作検出の改善:音声と映像ストリームの両方を使用して | 記事 | HyperAI超神経