Command Palette

Search for a command to run...

CompreCap 画像記述データセット

日付

1年前

サイズ

46.29 MB

組織

アリグループ

公開URL

github.com

論文URL

arxiv.org

CompreCap データセットは、詳細な画像の説明を生成する際の大規模な視覚言語モデルの精度と包括性を評価するために、中国科学技術大学や Ant Group などの機関によって 2024 年に共同で作成されました。関連する論文の結果は次のとおりです。包括的な画像キャプションのための有向シーングラフによる大規模視覚言語モデルのベンチマーク”。データセットには 560 の画像が含まれており、それぞれの画像にはオブジェクト、属性、関係性の細かいセマンティック セグメンテーションと注釈が付けられており、完全な有向シーン グラフ構造を形成しています。

データセットの構築は MSCOCO パノラマ セグメンテーション データセットに基づいていますが、拡張および改善されています。研究者らは、複数のよく知られたデータセットから一般的なオブジェクト カテゴリの語彙を構築し、これらのカテゴリに再注釈を付けて、より正確なセマンティック セグメンテーション マスクを提供しました。注釈の完全性を保証するために、分割領域が 95% 画像領域を超える画像のみが保持されます。その後、研究者らはこれらのオブジェクトに詳細な属性の説明を手動で追加し、オブジェクト間の重要な関係をマークして、完全な有向シーン グラフ構造を形成しました。

CompreCap データセットのアノテーション情報には、オブジェクトのセマンティック セグメンテーション マスク、詳細な属性の説明、オブジェクト間の方向関係が含まれます。このアノテーション情報は、一般的なオブジェクト カテゴリをカバーするだけでなく、オブジェクト間の複雑な関係を指向性シーン グラフの形式でキャプチャし、データセットが詳細な画像記述の生成の品質を包括的に評価できるようにします。

CompreCap.torrent
シーディング 1ダウンロード中 0ダウンロード完了 98総ダウンロード数 180
  • CompreCap/
    • README.md
      2.05 KB
    • README.txt
      4.11 KB
      • data/
        • CompreCap.zip
          46.29 MB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています