2ヶ月前
水の音:液体を注ぐことで物理的性質を推定する
Piyush Bagad; Makarand Tapaswi; Cees G. M. Snoek; Andrew Zisserman

要約
私たちは、日常的な活動でありながら興味深い「液体の注ぎ」における音響・視覚観測とその背後の物理学の関係を研究しています。容器に液体が注がれる音だけをもとに、液面の高さ、容器の形状とサイズ、注ぎ率、満タンになるまでの時間を自動的に推定することを目指しています。この目的達成のために、私たちは以下の手順を取りました:(i) 理論的にこれらの特性が基本周波数(ピッチ)から決定できることを示します;(ii) シミュレーションデータと物理に基づいた目的関数を使用して視覚データとともにピッチ検出モデルを教師ありで学習させます;(iii) 実際の注ぎ動画の大規模な新しいデータセットを導入し、系統的な研究を行います;(iv) 学習済みモデルが実際のデータからこれらの物理特性を推定できることを示します;そして最後に、(v) 様々な容器形状や他のデータセット、野生環境でのYouTube動画に対する強い汎化能力を示します。本研究は、音響学、物理学、学習の交差点にある狭いながらも豊かな問題に対する深い理解を提示しており、ロボットによる多感覚知覚の向上につながる応用を開拓しています。