HyperAIHyperAI超神経
ホームニュース論文チュートリアルデータセット百科事典SOTALLMモデルGPU ランキング学会
検索
サイトについて
日本語
HyperAIHyperAI超神経
  1. ホーム
  2. SOTA
  3. ビジュアルクエスチョンアンサリング
  4. Visual Question Answering On Benchlmm

Visual Question Answering On Benchlmm

評価指標

GPT-3.5 score

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
GPT-3.5 score
Paper TitleRepository
MiniGPT4-13B34.93MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models
InstructBLIP-7B44.63InstructBLIP: Towards General-purpose Vision-Language Models with Instruction Tuning
LLaVA-1.5-13B55.53Improved Baselines with Visual Instruction Tuning
Sphinx-V2-1K57.43SPHINX: The Joint Mixing of Weights, Tasks, and Visual Embeddings for Multi-modal Large Language Models
LLaVA-1.5-7B46.83Visual Instruction Tuning
InstructBLIP-13B45.03InstructBLIP: Towards General-purpose Vision-Language Models with Instruction Tuning
MiniGPTv2-7B30.1MiniGPT-v2: large language model as a unified interface for vision-language multi-task learning
GPT-4V58.37GPT-4 Technical Report
LLaVA-1-13B43.50Visual Instruction Tuning
Otter-7B39.13Otter: A Multi-Modal Model with In-Context Instruction Tuning
0 of 10 row(s) selected.
HyperAI

学習、理解、実践、コミュニティと共に人工知能の未来を構築する

日本語

サイトについて

私たちについてデータセットヘルプ

プロダクト

ニュースチュートリアルデータセット百科事典

リンク

TVM 中国語Apache TVMOpenBayes

© HyperAI超神経

TwitterBilibili