Visual Question Answering On Amber
評価指標
Accuracy
F1
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Accuracy | F1 |
---|---|---|
rlaif-v-aligning-mllms-through-open-source-ai | 88 | 90.9 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Accuracy | F1 |
---|---|---|
rlaif-v-aligning-mllms-through-open-source-ai | 88 | 90.9 |