17日前

動画理解におけるフェデレーテッド自己教師学習

Yasar Abbas Ur Rehman, Yan Gao, Jiajun Shen, Pedro Porto Buarque de Gusmao, Nicholas Lane
動画理解におけるフェデレーテッド自己教師学習
要約

カメラ搭載のモバイルデバイスの普及により、エッジ領域で大量のラベルなし動画データが生成されるようになっている。さまざまな自己教師付き学習(Self-Supervised Learning, SSL)手法が提案されており、これらのデータから潜在的な空間時系列表現を抽出し、タスク固有の学習に活用しようとしているが、実用的な課題としてプライバシー懸念や通信コストが、SSLの大規模な展開を阻んでいる。こうした課題を軽減するため、本研究では動画SSLのタスクにフェデレーテッドラーニング(Federated Learning, FL)を活用することを提案する。本研究では、Kinetics-400データセットを用いて大規模なFL環境をシミュレートし、現在の最先端(SOTA)動画SSL技術の性能を評価した上で、その大規模FL環境における統合における課題と限界を明らかにした。その後、異なる集約戦略と部分的重み更新を統合した新たなフェデレーテッドSSLフレームワーク「FedVSSL」を提案する。広範な実験により、FedVSSLが中央集権型SOTA手法を上回ることを確認した。特に、下流のリトリーバルタスクにおいて、UCF-101では6.66%、HMDB-51では5.13%の性能向上が達成された。

動画理解におけるフェデレーテッド自己教師学習 | 最新論文 | HyperAI超神経