VQA 시각적 질문 답변 데이터 세트

날짜

2년 전

크기

58.91 MB

기관

논문 URL

arxiv.org

라이선스

기타

태그

대형 모델

데이터셋 다운로드

Discord 커뮤니티 참여

이 데이터 세트는 다음에서 나옵니다. 캄피나스 주립대학교 MO434 과목 지식 기반.

소개

이는 이미지와 이미지에 대한 자연어 질문을 기반으로 답변을 생성하는 간단한 Flask 애플리케이션입니다. 이 앱은 TensorFlow로 학습된 딥 러닝 모델을 사용합니다.

모델 개요

딥러닝의 발전으로 다중 모드 학습 관련 과제의 솔루션이 촉진되었습니다. 시각적 질의응답(VQA)은 이미지에서 높은 수준의 장면 해석과 관련 질의응답 언어의 모델링이 필요한 매우 어려운 예입니다. 이미지와 이미지에 대한 자연어 질문이 주어졌을 때, 정확한 자연어 답변을 제공하는 것이 과제입니다. 이는 Keras를 사용하여 구현된 종단간 시스템으로, 이 작업을 달성하는 것을 목표로 합니다.

논문을 기반으로 한 모델 아키텍처 시각적 질의응답을 위한 계층적 질의-이미지 공동주의 .

VQA.torrent

시딩 2다운로드 중 0완료됨 216총 다운로드 횟수 416

VQA/
- README.md
  1.56 KB
- README.txt
  3.12 KB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩

즉시 사용 가능한 GPU

최적 가격

시작하기

Hyper Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

VQA 시각적 질문 답변 데이터 세트

소개

모델 개요

AI로 AI 구축

Hyper Newsletters