HyperAI초신경
Back to Headlines

상해교대 푸위안팀, 컴퓨터 비전 분야 ICCV에 논문 발표

7일 전

상하이교통대학교의 푸위안 미래기술대학 연구팀은 컴퓨터 비전 분야의 최고 학술대회인 IEEE/CVF 국제 컴퓨터 비전 회의(ICCV)에서 "다양한 검색 공간을 활용한 기반 세그멘테이션 모델 개선"이라는 제목의 논문을 발표했습니다. 이 연구는 장송안 교수가 지도한 것으로, 첫 번째 저자는 2023년도 닝더시대와 연합으로 석사 과정을 밟고 있는 정보통신공학 전공생 이리입니다. 연구 배경 일반적인 기반 세그멘테이션 모델은 변칙적 이미지 도메인(예: 위장된 객체, 의료 검출)에서 성능이 떨어집니다. 또한 데이터셋 준비에 어려움과 시간 제약 때문에 미세 조정(fine-tune)을 수행하기가 어렵습니다. 이를 해결하기 위해 이미지 예처리(pre-processing)를 통해 세그멘테이션 모델의 성능을 향상시키는 방법이 고려되었습니다. 연구 현황 현재의 이미지 증강 기법은 주로 규칙 기반(rule-based) 방법에 의존하고 있어 증강 효과가 제한적입니다. 학습 기반(learning-based) 방법은 다양한 증강 기법을 제공할 수 있지만, 규칙 기반 방법은 강도를 설명할 수 있는 반면(예: 약간/강하게 밝기 조정), 학습 기반 방법은 설명할 수 없는 강도의 목표(예: 깊이 추정)를 예측합니다. 이 두 가지 방법을 결합하면 이질적인 검색 공간(heterogeneous searching space)이 형성됩니다. 연구 결과 본 논문에서는 이러한 문제를 해결하기 위해 "자체 적응 증강"(Augment To Adapt) 패러다임을 제안합니다. 이 방법은 가장 효과적인 증강 전략을 규칙 기반 증강으로 대체하여 세그멘테이션 성능을 최적화합니다. 연구팀은 32가지 증강 기술(규칙 기반 22가지, 학습 기반 10가지)을 사용하여 파라미터 불일치 문제를 완화하고, 고내구성의 다항 이산 이질적인 검색 공간을 구축했습니다. 실제 환경에서 최적의 증강 전략을 적용하기 위해, 연구팀은 딥러닝 기술인 지식 증류(knowledge distillation)를 활용하여 예처리 과정을 가속화했습니다. 이 방법은 도메인 특화 증강 전략을 통해 모델의 적응성을 크게 향상시키며, NJU2k, VT1k, CAMO, NC4k, COD10k, Kvasir-SEG, BUSI, KoletorSDDV2, MTSD 등 9개 공개 데이터셋에서 그 성능 향상이 입증되었습니다. 저자 정보 이리는 상하이교통대학교 푸위안 미래기술대학의 정보통신공학 전공 석사과정 학생으로, 컴퓨터 비전, 강화학습, 도메인 적응 세그멘테이션 분야를 연구하고 있습니다. 장송안 교수는 상하이교통대학교 푸위안 미래기술대학의 정교수 트랙 조교수이며, 자율주행차 알고리즘 설계 분야의 전문가입니다. 그는 TITS, TIV, CVPR, ICCV 등의 저널과 학술대회에서 30여 편의 논문을 발표했습니다. 2013년과 2016년에 청화대학교 차량공학과에서 학사와 석사 학위를 받았으며, 2021년에는 미국 미시간대학교 기계공학과에서 박사 학위를 취득했습니다. 박사 학위 취득 후, 그는 미국 포드자동차사 로봇연구소에서 연구원으로 재직하며, 포드-대학 공동 프로젝트의 로봇 방향 제안 심사위원장을 맡았습니다. 2023년에 상하이교통대학교 푸위안 미래기술대학에 합류하였습니다. 업계 평가 및 회사 프로필 이 연구는 컴퓨터 비전 및 자율주행차 분야에서 중요한 진전을 이루었습니다. 업계 전문가들은 이 방법이 다양한 이미지 도메인에서 세그멘테이션 모델의 성능을 크게 향상시킬 수 있는 잠재력을 인정하고 있습니다. 특히, 데이터셋 준비와 시간 제약에 따른 미세 조정의 어려움을 해결하는 데 있어 혁신적인 접근방식으로 평가받고 있습니다. 상하이교통대학교의 푸위안 미래기술대학은 첨단 기술 연구와 교육에 중점을 둔 연구 중심 대학으로, 인공지능, 자동차 공학, 로봇공학 등 다양한 분야에서 활발한 연구를 진행하고 있습니다.

Related Links