
초록
본 논문의 목표는 행동의 공간-시간 범위를 감지하는 것입니다. RGB와 광류(Flow)를 기반으로 하는 두 스트림 검출 네트워크는 뛰어난 정확성을 제공하지만, 큰 모델 크기와 중량적인 계산이 필요합니다. 우리는 새로운 층을 도입하여 RGB와 광류를 단일 두-in-one 스트림 네트워크에 임베딩하는 방법을 제안합니다. 운동 조건 층은 광류 이미지에서 운동 정보를 추출하며, 이 정보는 운동 변조 층에서 저수준 RGB 특징을 변조하기 위한 변환 매개변수를 생성하는 데 활용됩니다. 본 방법은 기존의 외관- 또는 두 스트림 행동 검출 네트워크에 쉽게 임베딩될 수 있으며, 엔드-투-엔드로 훈련할 수 있습니다. 실험 결과, 운동 조건을 활용하여 RGB 특징을 변조하면 검출 정확성이 향상됨을 보여주었습니다. 최신 두 스트림 방법의 절반程度的计算和参数量,我们的二合一流仍能在UCF101-24、UCFSports和J-HMDB数据集上取得令人印象深刻的结果。(注:最后一句中有一部分是中文,我已将其翻译成韩文如下)최신 두 스트림 방법의 절반의 계산과 매개변수량으로도, 우리의 두-in-one 스트림은 UCF101-24, UCFSports 및 J-HMDB 데이터셋에서 인상적인 결과를 달성하였습니다.