HyperAIHyperAI

Command Palette

Search for a command to run...

FoMER Benchマルチモーダル評価データセット

日付

4ヶ月前

サイズ

7.03 GB

データセット構成

オーストラリア国立大学
リンシェーピング大学
モハメド・ビン・ザイード人工知能大学

Paper URL

2509.15293

ライセンス

Apache 2.0

FoMER ベンチは、モハメド ビン ザイード人工知能大学、リンショーピング大学、オーストラリア国立大学によって 2025 年にリリースされた Foundational Model Embodied Reasoning (FoMER) ベンチマークです。段階的な具体化推論における基礎モデルはどの程度優れているか?”は、複雑な具体化された意思決定シナリオにおける LMM の推論能力を評価することを目的としています。

このデータセットには1,100件以上の例が含まれており、10のタスクと8つの具体化推論タスクにわたる詳細な段階的推論を網羅しています。3種類のロボットタイプと複数のロボットモードを網羅しており、次のステップの行動予測、行動アフォーダンス、物理的常識、時間的推論、道具の使用と操作、リスク評価、ロボットナビゲーションなど、様々なタスクにおけるLLM能力の評価を可能にします。データには、多肢選択式質問(MCQ)、正誤問題(TF)、自由回答式質問が含まれています。各例には、入力観察(動画または画像フレーム+テキストプロンプト)、複数の候補行動、および対応する段階的推論トレースが付属しています。

FoMER.torrent
シーディング 1ダウンロード中 0完了 1総ダウンロード数 69
  • FoMER/
    • README.md
      1.79 KB
    • README.txt
      3.59 KB
      • data/
        • FoMER.zip
          7.03 GB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています