11일 전

Open-TransMind: 지능형 교통 분야의 1차 기초 모델 도전을 위한 새로운 베이스라인 및 벤치마크

Yifeng Shi, Feng Lv, Xinliang Wang, Chunlong Xia, Shaojie Li, Shujie Yang, Teng Xi, Gang Zhang
Open-TransMind: 지능형 교통 분야의 1차 기초 모델 도전을 위한 새로운 베이스라인 및 벤치마크
초록

최근 몇 년간 계산 능력과 딥러닝 알고리즘의 지속적인 향상에 따라 기초 모델(Foundation Model) 기술이 점차 인기를 끌고 있다. 이 기술은 뛰어난 능력과 뛰어난 성능을 바탕으로 다양한 산업에서 꾸준히 채택되고 적용되고 있다. 지능형 교통 분야에서는 인공지능이 다음과 같은 전형적인 과제에 직면해 있다: 소수 샘플 문제(Few-shot), 낮은 일반화 능력, 그리고 다중 모달 기술의 부족. 기초 모델 기술은 이러한 문제들을 크게 완화할 수 있다. 이를 해결하기 위해 우리는 기초 모델 기술이 교통 환경에서 더욱 널리 퍼지도록 유도하고, 지능형 교통 산업의 빠른 발전을 촉진하는 것을 목표로 '제1회 기초 모델 챌린지'를 기획하였다. 이 챌린지는 '일체형(All-in-one)'과 '다중 모달 이미지 검색(Cross-modal Image Retrieval)' 두 가지 트랙으로 나뉘어 진행된다. 또한, 두 트랙을 위한 새로운 베이스라인과 벤치마크로 'Open-TransMind'를 제안한다. 우리 연구팀의 관점에서, Open-TransMind는 다중 작업 및 다중 모달 기능을 갖춘 최초의 오픈소스 교통 기초 모델이다. 동시에, Open-TransMind는 교통 환경의 감지(Detection), 분류(Classification), 세분화(Segmentation) 데이터셋에서 최상의 성능을 달성할 수 있다. 관련 소스 코드는 https://github.com/Traffic-X/Open-TransMind 에서 공개되어 있다.

Open-TransMind: 지능형 교통 분야의 1차 기초 모델 도전을 위한 새로운 베이스라인 및 벤치마크 | 최신 연구 논문 | HyperAI초신경