オープンボキャブラリ画像分類 | SOTA | HyperAI超神経

オープンボキャブラリ画像分類は、コンピュータビジョンのサブタスクで、プロンプトや候補ラベルなしで英語の全名詞語彙から正確かつ詳細な分類ラベルを生成することを目指しています。このタスクの目的は、未知のカテゴリでもモデルが一般的に適用できるように、画像内の特定の物体やシーンを識別し説明することです。その応用価値は、大規模で多様な画像データを処理できることにあり、知能的な画像アノテーション、コンテンツ検索、自動レポート生成などの幅広い実用的なユースケースをサポートします。

OVIC Datasets (Wiki-H)

DFN-5B H/14-378 + PrefixedIter Decoder (FT2)

OVIC Datasets (World-H)

OVIC Datasets (Val3K)

OVIC Datasets (Wiki-L)