Command Palette

Search for a command to run...

2일 전

SAM 3: 개념을 활용한 모든 사물 분할

SAM 3: 개념을 활용한 모든 사물 분할

초록

다음은 요청하신 내용을 과학/기술 전문 번역 표준에 맞춰 한국어로 번역한 결과입니다.본 논문에서는 컨셉 프롬프트(concept prompts)를 기반으로 이미지 및 비디오 내 객체를 탐지(detect), 분할(segment), 추적(track)하는 통합 모델인 Segment Anything Model (SAM) 3를 제안한다. 여기서 컨셉 프롬프트는 짧은 명사구(예: "노란색 스쿨버스"), 이미지 예시(image exemplars) 또는 이 둘의 조합으로 정의된다. 프롬프트 기반 컨셉 분할(Promptable Concept Segmentation, PCS) 기술은 이러한 프롬프트를 입력받아 일치하는 모든 객체 인스턴스에 대한 분할 마스크(segmentation masks)와 고유 식별자(unique identities)를 반환한다.PCS 기술을 고도화하기 위해, 당사는 이미지와 비디오 전반에 걸쳐 하드 네거티브(hard negatives)를 포함한 400만 개의 고유 컨셉 레이블을 갖춘 고품질 데이터셋을 생성하는 확장 가능한 데이터 엔진을 구축하였다. 이 모델은 단일 백본(backbone)을 공유하는 이미지 수준 탐지기(image-level detector)와 메모리 기반 비디오 추적기(memory-based video tracker)로 구성된다. 또한 인식(recognition)과 위치 정밀화(localization) 과정은 프레즌스 헤드(presence head)를 통해 분리(decoupled)되어 탐지 정확도를 향상시켰다.SAM 3는 이미지 및 비디오 PCS 분야 모두에서 기존 시스템 대비 두 배의 정확도를 달성하였으며, 시각적 분할(visual segmentation) 작업에 있어 기존 SAM의 성능을 개선하였다. 당사는 SAM 3와 더불어 프롬프트 기반 컨셉 분할을 위한 새로운 벤치마크인 Segment Anything with Concepts (SA-Co)를 오픈 소스로 공개한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp