2달 전

D-FINE: DETRs의 회귀 작업을 세부적인 분포 정교화로 재정의하기

Yansong Peng; Hebei Li; Peixi Wu; Yueyi Zhang; Xiaoyan Sun; Feng Wu
D-FINE: DETRs의 회귀 작업을 세부적인 분포 정교화로 재정의하기
초록

D-FINE 소개: 이는 DETR 모델에서 바운딩 박스 회귀 작업을 재정의하여 뛰어난 위치 추정 정확도를 달성하는 강력한 실시간 객체 검출기입니다. D-FINE은 세부 분포 개선(Fine-grained Distribution Refinement, FDR)과 전역 최적 위치 추정 자기 증류(Global Optimal Localization Self-Distillation, GO-LSD)라는 두 가지 핵심 구성 요소로 이루어져 있습니다. FDR은 고정된 좌표를 예측하는 과정을 확률 분포를 반복적으로 개선하는 과정으로 변환하여, 위치 추정 정확도를 크게 향상시키는 세밀한 중간 표현을 제공합니다. GO-LSD는 양방향 최적화 전략으로, 자기 증류를 통해 개선된 분포에서 얕은 층으로 위치 추정 지식을 전달하면서 깊은 층의 잔여 예측 작업을 단순화합니다. 또한, D-FINE은 계산량이 많은 모듈과 연산에 경량화 최적화를 도입하여 속도와 정확도 사이의 균형을 더욱 잘 맞추었습니다.특히, D-FINE-L / X는 NVIDIA T4 GPU에서 COCO 데이터셋에서 54.0% / 55.8% AP를 124 / 78 FPS로 달성합니다. Objects365에서 사전 학습된 경우, D-FINE-L / X는 57.1% / 59.3% AP를 기록하며 모든 기존 실시간 검출기를 능가합니다. 더불어, 우리의 방법은 추가적인 매개변수와 학습 비용이 거의 없이 다양한 DETR 모델의 성능을 최대 5.3% AP까지 크게 향상시킵니다.코드 및 사전 학습된 모델: https://github.com/Peterande/D-FINE.

D-FINE: DETRs의 회귀 작업을 세부적인 분포 정교화로 재정의하기 | 최신 연구 논문 | HyperAI초신경