HyperAI

MMPR-Datensatz Für Multimodale Schlussfolgerungspräferenzen

Datum

vor 7 Monaten

Größe

29.29 GB

Organisation

Shanghaier Labor für künstliche Intelligenz
Fudan-Universität

Veröffentlichungs-URL

github.com

MMPR (Multimodal Preference Dataset) ist ein umfangreicher multimodaler Präferenzdatensatz, der 2024 gemeinsam von den Forschungsteams des Shanghai Artificial Intelligence Laboratory, der Fudan University, der Nanjing University, der Chinese University of Hong Kong, der Tsinghua University und SenseTime veröffentlicht wurde. Die entsprechenden Ergebnisse der Studie sind „Verbesserung der Argumentationsfähigkeit multimodaler großer Sprachmodelle durch gemischte PräferenzoptimierungDer Datensatz enthält 750.000 Beispiele ohne eindeutige richtige Antworten und 2,5 Millionen Beispiele mit eindeutigen richtigen Antworten. Die Beispiele decken mehrere Bereiche ab, wie z. B. VQA, Naturwissenschaften, Grafik, Mathematik, OCR und Dokumente, um Vielfalt zu gewährleisten. Bei der Erstellung des Datensatzes achteten die Forscher besonders darauf, falsch positive und negative Antworten aufgrund der Einschränkungen heuristischer Regeln zu vermeiden, insbesondere in den allgemeinen VQA- und Dokumentdomänen. Der Datensatz wurde entwickelt, um die Leistung des Modells bei multimodalen Denkaufgaben zu verbessern und gleichzeitig potenzielle negative Effekte während des Trainings zu vermeiden.

Beispiel für Daten von MMPR. Für Anweisungen mit eindeutigen richtigen Antworten schlug das Forschungsteam einen auf Richtigkeit basierenden Prozess vor, der mehrere Lösungen auswählt und diejenigen mit richtigen Antworten als Auswahlantworten und diejenigen mit falschen Antworten als Ablehnungsantworten behandelt. Für Befehle, für die es keine eindeutige richtige Antwort gibt, schlug das Forschungsteam vor, DropoutNTP zu verwenden, um eine Ablehnungsantwort zu generieren. Die Unterschiede zwischen den Auswahl- und Ablehnungsantworten werden durch Kursivschrift hervorgehoben. Rote Markierungen zeigen falsche Antworten an.

MMPR-OpenGVLab.torrent
Seeding 2Herunterladen 0Abgeschlossen 64Gesamtdownloads 64
  • MMPR-OpenGVLab/
    • README.md
      2.12 KB
    • README.txt
      4.25 KB
      • data/
        • MMPR.zip
          14.63 GB
          • MMPR/
            • README.md
              14.63 GB
            • annotations.zip
              16.03 GB
            • images.zip
              29.29 GB
            • meta.json
              29.29 GB