보행자 재식별에 대한 관심이 점점 더 높아지고 있습니다. 최근의 인기 주제는 무엇인가?

보행자 재식별 기술은 스마트 시티, 자율주행 등의 시나리오에서 널리 활용되고 있으며, 최근 몇 년 동안 급속한 발전을 이루었습니다. 이는 학습 데이터 규모의 확대와 딥러닝의 발전에 따른 것입니다.
수많은 군중 속에서 당신이 찾는 사람을 한눈에 찾을 수 있나요?
오늘날 이 작업은 컴퓨터에게는 아주 쉬운 일일 수 있습니다. 이는 최근 몇 년 동안 보행자 재식별 기술이 급속히 발전한 데 따른 것입니다.
사람 재식별, 보행자 재식별 또는 줄여서 ReID는 컴퓨터 비전 기술을 사용하여 이미지나 비디오 시퀀스에 특정 보행자가 있는지 여부를 판별하는 기술입니다. 직관적으로 말하면,옷차림, 체형, 헤어스타일 등의 특징을 통해 서로 다른 장면에서 동일한 대상을 식별할 수 있으므로 국경 간 추적 기술이라고도 합니다.

얼굴 인식에 이어 컴퓨터 비전 분야에서는 개인 재식별이 주요 연구 방향으로 떠올랐습니다.
얼굴 인식 기술은 매우 발달했지만, 많은 경우, 예를 들어 밀집된 군중, 감시 카메라의 낮은 해상도, 편향된 촬영 각도 등에서는 얼굴을 효과적으로 인식하기 어려운 경우가 많습니다.보행자 재식별은 중요한 보완책이 되었습니다.
따라서 얼굴 재인식은 최근 몇 년 동안 점점 더 많은 주목을 받고 있으며, 관련 응용 분야도 점차 확대되고 있습니다.
기술을 이해하려면 먼저 해당 기술이 어떤 문제를 해결하는지, 어떻게 획기적인 발전을 이루는지, 어떤 단계에 도달했는지, 어떤 과제에 직면해 있는지 이해해야 합니다. 다음으로, 종합적인 분석을 실시하겠습니다.
보행자 재식별은 어디에 사용됩니까?
우선, 앞서 언급했듯이 보행자 재식별은 얼굴 인식 기술을 보완하는 중요한 기술입니다.
얼굴 인식을 위한 전제 조건은 선명한 정면 얼굴 사진입니다. 하지만 이미지에 얼굴이 보이지 않는 등쪽이나 다른 각도만 표시될 경우 얼굴 인식에 실패하게 됩니다. 이때 보행자 재식별은 자세와 옷차림 등의 특징을 통해 대상 인물을 계속 추적할 수 있습니다.
현재 보행자 재식별 기술은 보안, 자율주행 등 다양한 분야에서 널리 활용되고 있습니다. 예를 들어:
스마트 보안:경찰 조사관은 ReID를 사용하여 의심스러운 사람을 신속하게 검거할 수 있습니다.
지능형 검색 시스템:공항이나 기차역 등 교통량이 많은 곳에서는 ReID를 활용해 길을 잃은 어린이와 노인을 찾을 수 있습니다.
스마트 비즈니스:ReID는 보행자 모습 사진을 기반으로 사용자 이동 경로를 실시간으로 동적으로 추적하여 쇼핑몰에서 사용자의 관심사를 파악하고 사용자 경험을 최적화할 수 있습니다.
자율 주행 시스템:ReID는 보행자를 더 잘 식별하고 자율 주행의 안전성을 향상시킬 수 있습니다.

기술 혁신의 핵심: 대규모 데이터 세트
관련 연구자들에 따르면 보행자 재식별 기술의 실현에는 일반적으로 다음의 5단계가 필요합니다.
- 데이터 수집;
- 경계 상자 생성
- 훈련 데이터 주석;
- 모델 학습;
- 보행자 회수
이 중 첫 번째 단계인 데이터 수집은 보행자 재식별 연구 전체의 기반이 됩니다.최근 몇 년 동안 대규모 데이터 세트의 홍보와 지원 덕분에 개인 재식별 분야에서 상당한 혁신이 이루어졌습니다.
이 글에서는 여러분의 연구와 모델 학습을 위해 일반적으로 사용되는 여러 보행자 감지 데이터 세트를 소개합니다.
INRIA 사람 데이터 세트 보행자 감지 데이터 세트
INRIA Person 데이터 세트는 현재 가장 인기 있고 널리 사용되는 정적 보행자 감지 데이터 세트 중 하나입니다.2005년에 INRIA(프랑스 국립 정보 및 자동화 연구소)에서 출판되었습니다. 이 데이터 세트는 이미지와 비디오에서 똑바로 선 보행자를 감지하는 데 사용됩니다.
이 데이터 세트에는 두 가지 형식의 데이터가 포함되어 있습니다.
카테고리 1: 원본 이미지와 해당 수직 보행자 주석
2번째 카테고리: 똑바로 선 보행자의 긍정적 이미지와 그에 해당하는 부정적 이미지를 64×128픽셀로 정규화한 것입니다.

데이터 세트의 기본 정보는 다음과 같습니다.
INRIA 개인 데이터 세트
출판사: 인리아
포함된 수량:훈련 세트와 테스트 세트에는 총 2573개의 이미지가 있습니다.
데이터 형식:양성 샘플은 .png 형식이고 음성 샘플은 .jpg 형식입니다.
데이터 크기:969MB
업데이트 시간:2005
다운로드 주소:https://orion.hyper.ai/datasets/5331
관련 논문:
UCSD 보행자 비디오 데이터 세트
UCSD 보행자 보행자 비디오 데이터는 캘리포니아 대학과 홍콩 시립 대학에서 수집 및 정리하여 2013년 2월에 공개되었습니다.
이 데이터 세트는 동작 분할과 군중 계수에 사용됩니다.이 데이터 세트에는 고정된 카메라로 촬영한 UCSD(캘리포니아 대학교, 샌디에이고 캠퍼스) 보도 위의 보행자 영상이 포함되어 있습니다.
모든 영상은 8비트 회색조, 크기 238×158, 초당 10프레임입니다. 원본 영상은 740×480, 초당 30프레임이며, 요청 시 제공 가능합니다.
비디오 디렉토리에는 두 장면의 비디오가 포함되어 있습니다(vidf와 vidd의 두 디렉토리로 구분됨). 각 장면은 자체 vidX 디렉토리에 있으며 .png 조각 세트로 분할됩니다.

데이터 세트의 기본 정보는 다음과 같습니다.
UCSD 보행자 데이터 세트
출판사: UCSD, 홍콩시립대학교
포함된 수량:약 10시간 분량의 영상
데이터 형식:.png
데이터 크기:비디오: 787MB; 비디오: 672MB
업데이트 시간:2013년 2월
다운로드 주소:https://orion.hyper.ai/datasets/9370
관련 논문:
Caltech 보행자 감지 벤치마크
캘리포니아 공과대학 보행자 감지 벤치마크 데이터베이스는 2009년 캘리포니아 공과대학에서 공개되었으며 매년 지속적으로 업데이트되고 있습니다.
이 데이터베이스는 현재 가장 큰 보행자 데이터베이스로, 약 10시간 분량의 영상을 담고 있습니다.이 영상은 주로 도시의 일반적인 교통 환경에서 운행하는 차량에 장착된 카메라로 촬영되었으며, 영상 해상도는 640×480, 초당 30프레임입니다.
영상에는 총 약 25만 개의 프레임(약 137분), 35만 개의 직사각형 상자, 2,300명의 보행자가 주석으로 달려 있습니다. 또한, 직사각형 상자와 그 폐색 조건 사이의 시간적 대응관계도 주석으로 표시됩니다.

데이터 세트의 기본 정보는 다음과 같습니다.
Caltech 보행자 데이터 세트
출판사: 캘리포니아 공과대학
포함된 수량:훈련 세트와 테스트 세트에는 총 2573개의 이미지가 있습니다.
데이터 형식:.jpg
데이터 크기:11.12GB
업데이트 시간:2019년 7월
다운로드 주소:https://orion.hyper.ai/datasets/5334
관련 논문:
고급 방법은 무엇입니까?
개인 재식별 분야의 연구는 거의 30년 동안 진행되어 왔습니다. 최근 몇 년 동안, 이 기술은 대규모 데이터 세트와 딥 러닝의 발전 덕분에 큰 진전을 이루었습니다.
여기서는 여러분의 공부와 참고를 위해 두 가지 최신 방법을 소개하겠습니다.
다양한 카메라 간의 스타일 차이점 제거
컴퓨터 비전 분야 최고 국제 학술대회인 CVPR 2020에서 중국과학원에서 논문을 발표했습니다. 개인 재식별을 위한 Unity 스타일 전송가운데,다양한 카메라 간의 스타일 차이를 통합할 수 있는 UnityStyle 적응 방법이 제안되었습니다.

같은 카메라든 다른 카메라든, 사진을 촬영할 때 시간, 조명, 날씨 등의 영향으로 인해 큰 차이가 발생하게 되고, 이는 타겟 질의에 어려움을 초래합니다.
이 문제를 해결하기 위해 연구팀은 먼저 UnityGAN을 만들어 카메라 간의 스타일 변화를 학습하고 각 카메라에 대해 모양이 안정적인 스타일 유니티 이미지를 생성했습니다. 이를 UnityStyle 이미지라고 합니다.
동시에,그들은 UnityStyle 이미지를 사용하여 다양한 이미지 간의 스타일 차이를 매끄럽게 만듭니다., 이렇게 하면 쿼리(쿼리 대상)와 갤러리(이미지 라이브러리)가 더 잘 매칭됩니다.
그런 다음 그들은 제안된 방법을 재식별 모델에 적용하여 쿼리에 대해 더욱 스타일이 견고한 심층적 특징을 얻을 것으로 기대했습니다.

연구팀은 제안된 프레임워크의 성능을 평가하기 위해 널리 사용되는 벤치마크 데이터세트에 대한 광범위한 실험을 수행했으며, 실험 결과를 통해 제안된 모델의 우수성이 확인되었습니다.
보행자 폐쇄 문제 해결
CVPR 2020에서 Megvii Research Institute가 발표한 논문 "고차원 정보의 중요성: 가려진 사람 재식별을 위한 학습 관계 및 토폴로지"가운데,이 기술은 이 분야에서 가장 흔하고 어려운 문제인 보행자 폐쇄 문제를 해결합니다.

본 논문에서 Megvii Research Institute가 제안한 프레임워크는 다음과 같습니다.
- 인체의 주요 부위의 의미적 특징을 추출할 수 있는 1차 의미 모듈(S)
- 다양한 의미적 로컬 피처 간의 관계 정보를 모델링할 수 있는 고차 관계 모듈(R)
- 견고한 정렬을 학습하고 두 이미지 간의 유사성을 예측하는 고차원 인간 토폴로지 모듈(T)입니다.
이 세 가지 모듈은 종단 간 방식으로 공동으로 훈련됩니다.

이전에 우리는역사상 가장 뜨거운 ECCV가 열렸고, 이 논문들은 정말 흥미롭습니다.화중과학기술대학교, 중산대학, 텐센트 유투랩이 공동으로 발표한 논문 "방해하지 마세요: 다른 보행자의 간섭 하에서의 보행자 재식별"이 소개되었습니다. 본 논문에서 제안하는 방법은 혼잡한 장면에서 배경 보행자 간섭이나 인체 가려짐으로 인해 발생하는 잘못된 검색 결과의 문제를 해결합니다. 관심 있는 학생은 다시 검토해 볼 수 있습니다.
뜨거운 기술이지만 여전히 어려움은 있다
현재 보행자 재식별은 데이터, 효율성, 성능 및 기타 측면을 포함하여 여전히 상당한 과제에 직면해 있습니다.
데이터 측면에서, 획득된 영상 데이터는 다양한 장면(실내 및 실외 등), 다양한 계절에 따른 스타일의 변화, 다양한 시간대(낮과 밤 등)의 조명 차이 등으로 인해 매우 다르게 나타납니다. 이러한 모든 요소는 보행자 재식별에 방해가 됩니다.이러한 간섭 요인은 모델 인식 정확도뿐만 아니라 인식 효율성에도 영향을 미칩니다.

따라서 기존 사례에서 보행자 재식별이 인간의 해결 능력을 능가했음을 확인했지만, 여전히 해결해야 할 문제가 많이 있습니다.
다음 링크로 이동하세요:https://orion.hyper.ai/datasets,"보행자"를 검색하거나 클릭하세요원본 기사를 읽어보세요.더 많은 보행자 감지 데이터 세트를 사용할 수 있습니다.
-- 위에--