2달 전

SegGPT: 문맥에서 모든 것을 분할하다

Xinlong Wang; Xiaosong Zhang; Yue Cao; Wen Wang; Chunhua Shen; Tiejun Huang
SegGPT: 문맥에서 모든 것을 분할하다
초록

우리는 모든 것을 문맥 내에서 분할하는 일반 모델인 SegGPT를 소개합니다. 다양한 분할 작업을 동일한 이미지 형식으로 변환하여 다양한 종류의 분할 데이터를 수용하는 일반적인 문맥 학습 프레임워크로 통합하였습니다. SegGPT의 훈련은 각 데이터 샘플에 대해 무작위 색상 매핑을 사용한 문맥 내 색칠 문제로 정식화되었습니다. 목표는 특정 색상에 의존하지 않고 문맥에 따라 다양한 작업을 수행하는 것입니다. 훈련 후, SegGPT는 객체 인스턴스, 물질, 부분, 윤곽선 및 텍스트와 같은 이미지나 비디오에서 임의의 분할 작업을 문맥 추론을 통해 수행할 수 있습니다. SegGPT는 소수 샷 의미 분할, 비디오 객체 분할, 의미 분할 및 팬옵틱 분할 등 광범위한 작업에서 평가되었습니다. 우리의 결과는 질적 또는 양적으로 도메인 내외의 대상物를 분할하는 강력한 능력을 보여줍니다.注:在最后一句中,“대상物” 是“targets”的翻译,但为了更符合韩语表达习惯,可以将其简化为“대상”。因此,最终翻译如下:우리는 모든 것을 문맥 내에서 분할하는 일반 모델인 SegGPT를 소개합니다. 다양한 분할 작업을 동일한 이미지 형식으로 변환하여 다양한 종류의 분할 데이터를 수용하는 일반적인 문맥 학습 프레임워크로 통합하였습니다. SegGPT의 훈련은 각 데이터 샘플에 대해 무작위 색상 매핑을 사용한 문맥 내 색칠 문제로 정식화되었습니다. 목표는 특정 색상에 의존하지 않고 문맥에 따라 다양한 작업을 수행하는 것입니다. 훈련 후, SegGPT는 객체 인스턴스, 물질, 부분, 윤곽선 및 텍스트와 같은 이미지나 비디오에서 임의의 분할 작업을 문맥 추론을 통해 수행할 수 있습니다. SegGPT는 소수 샷 의미 분할, 비디오 객체 분할, 의미 분절 및 팬옵틱 분절 등 광범위한 작업에서 평가되었습니다. 우리의 결과는 질적 또는 양적으로 도메인 내외의 대상을 분할하는 강력한 능력을 보여줍니다.

SegGPT: 문맥에서 모든 것을 분할하다 | 최신 연구 논문 | HyperAI초신경