Multi Label Classification
コンピュータビジョンは、機械が画像や動画を解釈し理解する技術です。この技術の目的は、人間の視覚システムを模倣することで複雑なシーンの自動認識と分析を達成することです。コンピュータビジョンは医療画像診断、自動運転、セキュリティ監視などの分野で広く応用されており、効率性和正確性を大幅に向上させ、知能社会の発展に貢献しています。
ChestX-ray14
SynthEnsemble
CheXpert
CFT (ensemble) Macao Polytechnic University
MIMIC-CXR
DensNet121
MLRSNet
ResNet50 (fine-tuning)
MRNet
MRNet
MS-COCO
ADDS(ViT-L-336, resolution 1344)
NUS-WIDE
Q2L-CvT(resolution 384, ImageNet-21K pretrained)
OpenImages-v6
TResNet-L
PASCAL VOC 2007
Q2L-CvT(ImageNet-21K pretrained, resolution 384)
PASCAL VOC 2012
Q2L-TResL(448 resolution)