HyperAI초신경

더 많은 다중 모드 객체-엔터티 관계 추출 데이터 세트

날짜

8달 전

크기

2.86 GB

기관

발행 주소

github.com

MORE(A Multimodal Object-Entity Relation Extraction Dataset)는 난징대학교 국가중점연구실에서 2024년에 제안한 다중모달 객체-엔티티 관계 추출 데이터셋입니다. 관련 논문 결과는 다음과 같습니다.추가 정보: 벤치마크 평가를 포함한 다중 모드 객체-엔터티 관계 추출 데이터 세트".

텍스트와 이미지 정보를 결합한 이 데이터 세트는 머신 러닝 모델이 텍스트에서 엔티티를 정확하게 추출하고 이미지의 시각적 객체와 올바른 관계를 설정하는 복잡한 과제를 제시합니다. MORE 데이터 세트에는 21개의 서로 다른 관계 유형이 포함되어 있으며, 3,559쌍의 텍스트 캡션과 해당 이미지로 주석이 달린 20,264개의 다중 모드 관계 사실을 다룹니다. 데이터 세트의 각 사실에는 텍스트에서 인식되는 엔터티와 이미지에서 감지되는 객체가 포함되는데, 이를 위해서는 모델이 텍스트 콘텐츠를 이해할 뿐만 아니라 이미지 콘텐츠도 인식하고 이해할 수 있어야 합니다. 또한, 이 데이터 세트에는 13,520개의 시각적 객체가 포함되어 있으며, 이미지당 평균 3.8개의 객체가 있습니다.

텍스트에서 2개의 엔터티와 이미지에서 여러 개의 시각적 개체를 포함하는 MORE의 예는 2개의 새로운 다중 모드 관계 사실을 생성합니다.

MORE.torrent
시딩 1다운로드 중 0완료됨 138총 다운로드 횟수 118
  • MORE/
    • README.md
      1.84 KB
    • README.txt
      3.67 KB
      • data/
        • A-Multimodal-Object-Entity-Relation-Extraction-Dataset.zip
          2.86 GB