HyperAIHyperAI

Command Palette

Search for a command to run...

UNO-Bench フルモーダル評価ベンチマークデータセット

Date

2ヶ月前

Size

9.71 GB

Organization

美団

Paper URL

2510.18915

License

MIT

UNO-Benchは、2025年にMeituanのLongCatチームによってリリースされた最初の統合フルモーダル評価ベンチマークです。関連論文のタイトルは「UNO-Bench: オムニモデルにおけるユニモーダルとオムニモーダル間の構成法則を探るための統一ベンチマーク目標は、シングルモーダルおよびマルチモーダルの理解能力を効率的に評価することです。

このデータセットには、98%のクロスモーダル解法を持つ1250個のフルモーダルサンプルと2480個のシングルモーダルサンプルが含まれており、44種類のタスクタイプと5種類のモーダリティの組み合わせをカバーしています。データセットには、6種類の質問タイプの自動評価をサポートする汎用スコアリングモデルも含まれており、マルチモーダルタスクの統一された評価基準を提供します。フルモーダルサンプルは、特に中国語の文脈に適した、実際のアプリケーションに近づけるよう人間によって慎重に構築されています。シングルモーダルサンプルは、基本的な認知機能と能力の側面を補完することで、全体的な評価をより包括的なものにしています。

データ構造:

データは Parquet 形式で保存され、各サンプルには構造化フィールドが含まれています。

  • qid (サンプルID)、subset_name (サブセット名)。
  • 質問(テキストによる質問)と回答(標準的な回答)
  • 画像 / 音声 / ビデオ (マルチモーダル コンテンツ、ファイル パスは辞書として保存され、存在しない場合は null)。
  • task (44 個のタスク タグ)、ability (能力タイプ)、source (データ ソース)、score_type (スコアリング方法)。
データセットの例
UNO-Bench.torrent
Seeding 1Downloading 0Completed 1Total Downloads 49
  • UNO-Bench/
    • README.md
      1.97 KB
    • README.txt
      3.93 KB
      • data/
        • UNO-Bench.zip
          9.71 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています