Panoptic Segmentation
コンピュータビジョンは、機械が画像や動画を解釈し理解する技術です。この技術の目的は、人間の視覚システムを模倣することで複雑なシーンの自動認識と分析を実現することです。コンピュータビジョンは医療画像診断、自動運転、セキュリティ監視などの分野で広く応用されており、効率性和正確性を大幅に向上させ、知能化社会の発展に貢献しています。
ADE20K
MasQCLIP
ADE20K val
OneFormer (DiNAT-L, single-scale, 1280x1280, COCO-Pretrain)
Cityscapes test
OneFormer (ConvNeXt-L, single-scale, Mapillary Vistas-Pretrained)
Cityscapes val
Panoptic FCN* (Swin-L, Cityscapes-fine)
COCO minival
OpenSeeD (SwinL, single-scale)
COCO panoptic
VAN-B6*
COCO test-dev
Mask DINO (single scale)
DALES
SuperCluster
Hypersim
Indian Driving Dataset
EfficientPS
KITTI-360
KITTI Panoptic Segmentation
EfficientPS
LaRS
Mask2Former (Swin-B)
Mapillary val
OneFormer (DiNAT-L, single-scale)
MUSES: MUlti-SEnsor Semantic perception dataset
NYU Depth v2
PanNuke
LKCell
Panoptic nuScenes test
(AF)2-S3Net + CenterPoint
Panoptic nuScenes val
PASTIS
Exchanger+Mask2Former
PASTIS-R
Early Fusion
S3DIS
S3DIS Area5
ScanNet
OneFormer3D
ScanNetV2
OneFormer3D
SemanticKITTI
P3Former
SUN-RGBD