온라인 동작 검출을 위한 장단기 트랜스포머

우리는 온라인 행동 검출을 위한 시계열 모델링 알고리즘인 Long Short-term TRansformer (LSTR)를 제시합니다. 이 알고리즘은 장기 및 단기 기억 메커니즘을 활용하여 긴 시퀀스 데이터를 모델링합니다. LSTR는 확장된 시간 창(예: 최대 8분에 해당하는 2048프레임)에서 대규모 역사적 정보를 동적으로 활용하는 LSTR 인코더와, 짧은 시간 창(예: 8초에 해당하는 32프레임)에 초점을 맞추어 데이터의 세부 특성을 모델링하는 LSTR 디코더로 구성됩니다. 기존 연구와 비교할 때, LSTR는 적은 휴리스틱을 사용하여 장시간 비디오를 효과적이고 효율적으로 모델링하는 방법을 제공하며,这一点通过广泛的实证分析得到了验证。LSTR在三个标准的在线行为检测基准测试中实现了最先进的性能,分别是THUMOS'14、TVSeries和HACS Segment。代码已发布在: https://xumingze0308.github.io/projects/lstr为了确保翻译的准确性,我需要对最后一句进行修正:这一点通过广泛的实证分析得到了验证。LSTR在三个标准的在线行为检测基准测试中实现了最先进的性能,分别是THUMOS'14、TVSeries和HACS Segment。代码已发布在: https://xumingze0308.github.io/projects/lstr修正后的韩文翻译如下:이 점은 광범위한 실증 분석을 통해 입증되었습니다. LSTR는 THUMOS'14, TVSeries, HACS Segment라는 세 가지 표준 온라인 행동 검출 벤치마크에서 최고 수준의 성능을 달성했습니다. 코드는 다음 주소에서 제공됩니다: https://xumingze0308.github.io/projects/lstr