@article{yu2023rlhf, title={Rlhf-v: Towards trustworthy mllms via behavior alignment from fine-grained correctional human feedback}, author={Yu, Tianyu and Yao, Yuan and Zhang, Haoye and He, Taiwen and Han, Yifeng and Cui, Ganqu and Hu, Jinyi and Liu, Zhiyuan and Zheng, Hai-Tao and Sun, Maosong and others}, journal={arXiv preprint arXiv:2312.00849}, year={2023} } @article{yu2024rlaifv, title={RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness}, author={Tianyu Yu and Haoye Zhang and Qiming Li and Qixin Xu and Yuan Yao and Da Chen and Xiaoman Lu and Ganqu Cui and Yunkai Dang and Taiwen He and Xiaocheng Feng and Jun Song and Bo Zheng and Zhiyuan Liu and Tat-Seng Chua and Maosong Sun}, journal={arXiv preprint arXiv:2405.17220}, year={2024}, } @misc{yu2025minicpmv45cookingefficient, title={MiniCPM-V 4.5: Cooking Efficient MLLMs via Architecture, Data, and Training Recipe}, author={Tianyu Yu and Zefan Wang and Chongyi Wang and Fuwei Huang and Wenshuo Ma and Zhihui He and Tianchi Cai and Weize Chen and Yuxiang Huang and Yuanqian Zhao and Bokai Xu and Junbo Cui and Yingjing Xu and Liqing Ruan and Luoyuan Zhang and Hanyu Liu and Jingkun Tang and Hongyuan Liu and Qining Guo and Wenhao Hu and Bingxiang He and Jie Zhou and Jie Cai and Ji Qi and Zonghao Guo and Chi Chen and Guoyang Zeng and Yuxuan Li and Ganqu Cui and Ning Ding and Xu Han and Yuan Yao and Zhiyuan Liu and Maosong Sun}, year={2025}, eprint={2509.18154}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2509.18154}, }

날짜

2년 전

크기

11.77 GB

조직

Paper URL

arxiv.org

태그

다중모달

RLAIF-V 데이터 세트는 다양한 작업과 도메인을 포괄하는 AI가 생성한 다중 모드 선호도 데이터 세트입니다. 이 데이터 세트에는 다중 모드 대규모 언어 모델(MLLM)을 훈련하고 평가하기 위한 44,757개 이상의 고품질 쌍이 포함되어 있습니다. RLAIF-V 데이터 세트는 오픈 소스 대규모 모델을 사용하여 모델 응답의 교란을 해소하는 새로운 접근 방식을 사용하며, 다양한 MLLM의 환각 현상을 줄이기 위해 고품질 피드백 데이터를 제공합니다. 또한 RLAIF-V 데이터 세트는 최초의 엔드투엔드 GPT-4V 수준 MLLM17을 나타내는 MiniCPM-Llama3-V 2.5 모델을 훈련하는 데에도 사용됩니다. RLAIF-V 프로젝트는 연구 커뮤니티에서 코드, 가중치(7B, 12B) 및 데이터를 오픈 소스로 공개하여 사용 및 추가 연구에 활용할 수 있도록 했습니다. RLAIF-V 데이터 세트의 주요 특징은 다음과 같습니다.

고품질 피드백 데이터: 데이터 세트에 사용된 다양한 MLLM을 통해 환각을 효과적으로 감소시켰습니다.
오픈소스: 데이터 세트는 완전히 오픈 소스이므로 연구자들은 자유롭게 접근하여 사용할 수 있습니다.
멀티태스킹 및 멀티도메인: 이 데이터 세트는 광범위한 작업과 도메인을 포괄하여 다양한 선호도 데이터를 제공합니다. RLAIF-V 데이터 세트의 라이선스는 CC BY NC 4.0으로, 비상업적 사용에만 허용되며, 이 데이터 세트를 사용하여 학습한 모델은 연구 목적 이외의 용도로 사용해서는 안 됩니다.

소환

@article{yu2023rlhf,
title={Rlhf-v: Towards trustworthy mllms via behavior alignment from fine-grained correctional human feedback},
author={Yu, Tianyu and Yao, Yuan and Zhang, Haoye and He, Taiwen and Han, Yifeng and Cui, Ganqu and Hu, Jinyi and Liu, Zhiyuan and Zheng, Hai-Tao and Sun, Maosong and others},
journal={arXiv preprint arXiv:2312.00849},
year={2023}
}
@article{yu2024rlaifv,
title={RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness},
author={Tianyu Yu and Haoye Zhang and Qiming Li and Qixin Xu and Yuan Yao and Da Chen and Xiaoman Lu and Ganqu Cui and Yunkai Dang and Taiwen He and Xiaocheng Feng and Jun Song and Bo Zheng and Zhiyuan Liu and Tat-Seng Chua and Maosong Sun},
journal={arXiv preprint arXiv:2405.17220},
year={2024},
}
@misc{yu2025minicpmv45cookingefficient,
title={MiniCPM-V 4.5: Cooking Efficient MLLMs via Architecture, Data, and Training Recipe},
author={Tianyu Yu and Zefan Wang and Chongyi Wang and Fuwei Huang and Wenshuo Ma and Zhihui He and Tianchi Cai and Weize Chen and Yuxiang Huang and Yuanqian Zhao and Bokai Xu and Junbo Cui and Yingjing Xu and Liqing Ruan and Luoyuan Zhang and Hanyu Liu and Jingkun Tang and Hongyuan Liu and Qining Guo and Wenhao Hu and Bingxiang He and Jie Zhou and Jie Cai and Ji Qi and Zonghao Guo and Chi Chen and Guoyang Zeng and Yuxuan Li and Ganqu Cui and Ning Ding and Xu Han and Yuan Yao and Zhiyuan Liu and Maosong Sun},
year={2025},
eprint={2509.18154},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/2509.18154},
}

RLAIF-V-Dataset.torrent

시딩 1다운로드 중 0완료됨 215총 다운로드 수 307

RLAIF-V-Dataset/
- README.md
  1.86 KB
- README.txt
  3.72 KB

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

undefined

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

HyperAI

다운로드

Discord에서 논의하기

날짜

2년 전

크기

11.77 GB

조직

Paper URL

arxiv.org

태그

다중모달

고품질 피드백 데이터: 데이터 세트에 사용된 다양한 MLLM을 통해 환각을 효과적으로 감소시켰습니다.
오픈소스: 데이터 세트는 완전히 오픈 소스이므로 연구자들은 자유롭게 접근하여 사용할 수 있습니다.
멀티태스킹 및 멀티도메인: 이 데이터 세트는 광범위한 작업과 도메인을 포괄하여 다양한 선호도 데이터를 제공합니다. RLAIF-V 데이터 세트의 라이선스는 CC BY NC 4.0으로, 비상업적 사용에만 허용되며, 이 데이터 세트를 사용하여 학습한 모델은 연구 목적 이외의 용도로 사용해서는 안 됩니다.

소환

@article{yu2023rlhf,
title={Rlhf-v: Towards trustworthy mllms via behavior alignment from fine-grained correctional human feedback},
author={Yu, Tianyu and Yao, Yuan and Zhang, Haoye and He, Taiwen and Han, Yifeng and Cui, Ganqu and Hu, Jinyi and Liu, Zhiyuan and Zheng, Hai-Tao and Sun, Maosong and others},
journal={arXiv preprint arXiv:2312.00849},
year={2023}
}
@article{yu2024rlaifv,
title={RLAIF-V: Open-Source AI Feedback Leads to Super GPT-4V Trustworthiness},
author={Tianyu Yu and Haoye Zhang and Qiming Li and Qixin Xu and Yuan Yao and Da Chen and Xiaoman Lu and Ganqu Cui and Yunkai Dang and Taiwen He and Xiaocheng Feng and Jun Song and Bo Zheng and Zhiyuan Liu and Tat-Seng Chua and Maosong Sun},
journal={arXiv preprint arXiv:2405.17220},
year={2024},
}
@misc{yu2025minicpmv45cookingefficient,
title={MiniCPM-V 4.5: Cooking Efficient MLLMs via Architecture, Data, and Training Recipe},
author={Tianyu Yu and Zefan Wang and Chongyi Wang and Fuwei Huang and Wenshuo Ma and Zhihui He and Tianchi Cai and Weize Chen and Yuxiang Huang and Yuanqian Zhao and Bokai Xu and Junbo Cui and Yingjing Xu and Liqing Ruan and Luoyuan Zhang and Hanyu Liu and Jingkun Tang and Hongyuan Liu and Qining Guo and Wenhao Hu and Bingxiang He and Jie Zhou and Jie Cai and Ji Qi and Zonghao Guo and Chi Chen and Guoyang Zeng and Yuxuan Li and Ganqu Cui and Ning Ding and Xu Han and Yuan Yao and Zhiyuan Liu and Maosong Sun},
year={2025},
eprint={2509.18154},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/2509.18154},
}

RLAIF-V-Dataset.torrent

시딩 1다운로드 중 0완료됨 215총 다운로드 수 307

RLAIF-V-Dataset/
- README.md
  1.86 KB
- README.txt
  3.72 KB

24일 전

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

RLAIF-V-데이터셋 대규모 다중 모드 선호도 데이터셋

소환

AI로 AI 구축

HyperAI Newsletters

Command Palette

RLAIF-V-데이터셋 대규모 다중 모드 선호도 데이터셋

소환

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

Verbatim Spans 쿼리 조건 증거 추출 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

FigureBench 과학 일러스트레이션 생성 벤치마크 데이터 세트

TACK 타겟 키메라 지식 기반 데이터 세트

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

DeepCrack 인프라 크랙 탐지 데이터셋

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

AgentTrove 지능형 에이전트 상호작용 궤적 데이터 세트

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

장거리 산불 및 연기 감지 데이터 세트

QCalEval 양자 교정 그래프 이해 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

AI로 AI 구축

HyperAI Newsletters

Command Palette

RLAIF-V-데이터셋 대규모 다중 모드 선호도 데이터셋

소환

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

Verbatim Spans 쿼리 조건 증거 추출 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

FigureBench 과학 일러스트레이션 생성 벤치마크 데이터 세트

TACK 타겟 키메라 지식 기반 데이터 세트

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

DeepCrack 인프라 크랙 탐지 데이터셋

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

AgentTrove 지능형 에이전트 상호작용 궤적 데이터 세트

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

장거리 산불 및 연기 감지 데이터 세트

QCalEval 양자 교정 그래프 이해 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

AI로 AI 구축

HyperAI Newsletters

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

Verbatim Spans 쿼리 조건 증거 추출 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

FigureBench 과학 일러스트레이션 생성 벤치마크 데이터 세트

TACK 타겟 키메라 지식 기반 데이터 세트

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

DeepCrack 인프라 크랙 탐지 데이터셋

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

AgentTrove 지능형 에이전트 상호작용 궤적 데이터 세트

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

장거리 산불 및 연기 감지 데이터 세트

QCalEval 양자 교정 그래프 이해 데이터 세트

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트