HyperAI초신경

Visual Question Answering On Mmhal Bench

평가 지표

Hallucination Rate
Score

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름
Hallucination Rate
Score
Paper TitleRepository
RLAIF-V 7B29.23.06RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness
RLAIF-V 12B29.23.36RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness
0 of 2 row(s) selected.