Datum

vor 2 Jahren

Größe

509.65 KB

Organisation

Paper-URL

Hintergrund

Leistungsbenchmarking für Chemikalien im großen Maßstab Die meisten bestehenden Leistungsbenchmarks für chemische Aufgaben sind für Expertenmodelle bestimmter Aufgaben wie MoleculeNet konzipiert. Für die Prüfung von LLMs sind sie jedoch möglicherweise nicht geeignet. Die meisten der bestehenden groß angelegten Sprachmodell-Benchmarks in der Chemie übernehmen das Frage-Antwort-Format und verwenden BLEU und ROUGE als Bewertungsmetriken. Diese Art der Auswertung kann jedoch erheblich durch den Ausgabestil des Sprachmodells beeinflusst werden und ist nicht für Szenarien geeignet, in denen die Richtigkeit wissenschaftlicher Fakten im Vordergrund steht. In diesem Fall können die Antworten, wenn sie einen ähnlichen Sprachstil aufweisen, trotz sachlicher Fehler sogar eine höhere Bewertung erhalten. Aus diesem Grund hat sich das Forschungsteam für die Erstellung eines Chemie-Benchmarks entschieden, der aus Multiple-Choice-Fragen besteht und den aktuellen gängigen Bewertungssätzen MMLU 30 und C-Eval ähnelt.

Datensatzübersicht

Um das Chemieverständnis von Sprachmodellen streng zu bewerten, hat das Forschungsteam ChemBench eingeführt, einen innovativen Benchmark, der aus neun Aufgaben zu chemischen Molekülen und Reaktionen besteht (die gleichen Aufgaben wie in ChemData), mit 4.100 Multiple-Choice-Fragen mit einer richtigen Antwort. Dieser Benchmark legt den Grundstein für die objektive Messung der Chemie großer Sprachmodelle. Die Verteilung aller Aufgaben in ChemBench ist in der Abbildung dargestellt.

Einführung in andere Open-Source-Datensätze

Klicken Sie hier, um die chinesischen und englischen Versionen der Datensätze ChemData700K, ChemPref-10K und C-MHChem zu verwenden

ChemBench-4K-Datensatz

ChemData700K ist ein großer Datensatz zur Feinabstimmung von Sprachmodell-Chemiefähigkeiten, der neun Kernaufgaben der Chemie und 730.000 hochwertige Fragen und Antworten enthält, die aus 1/10 der sieben Millionen Daten stammen. Der Datensatz deckt ein breites Spektrum an chemischem Fachwissen ab und folgt drei Hauptaufgabenkategorien (Moleküle, Reaktionen und Domänen).

ChemPref-10K-Datensatz

Dieser Datensatz kann zur Optimierung von Sprachmodellen verwendet werden, damit sie den menschlichen Vorlieben entsprechen, und enthält sowohl eine englische als auch eine chinesische Version.

C-MHChem-Datensatz

C-MHChem ist ein hochwertiger, vollständig manuell verfasster Multiple-Choice-Test, der aus 600 Fragen besteht, die in den letzten 25 Jahren bei Aufnahmeprüfungen für Mittelschulen, Gymnasien und Hochschulen in verschiedenen Teilen Chinas gesammelt wurden.

ChemBench4K.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 200Gesamtdownloads 372

ChemBench4K/
- README.md
  3.08 KB
- README.txt
  6.17 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

509.65 KB

Organisation

Paper-URL

arxiv.org

Hintergrund

Datensatzübersicht

Einführung in andere Open-Source-Datensätze

Klicken Sie hier, um die chinesischen und englischen Versionen der Datensätze ChemData700K, ChemPref-10K und C-MHChem zu verwenden

ChemBench-4K-Datensatz

ChemPref-10K-Datensatz

Dieser Datensatz kann zur Optimierung von Sprachmodellen verwendet werden, damit sie den menschlichen Vorlieben entsprechen, und enthält sowohl eine englische als auch eine chinesische Version.

C-MHChem-Datensatz

ChemBench4K.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 200Gesamtdownloads 372

ChemBench4K/
- README.md
  3.08 KB
- README.txt
  6.17 KB

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

vor 5 Monaten

THINGS-MEG-Magnetoenzephalographie-Datensatz

vor 5 Monaten

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

vor 5 Monaten

RoVid-X-Roboter-Videogenerierungsdatensatz

vor 2 Monaten

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

vor 5 Monaten

RealTimeFaceSwap-10k Video Call Spoofing Dataset

vor 5 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

ChemBench4K Benchmark-Datensatz Zur Bewertung Der Chemischen Fähigkeiten

Hintergrund

Datensatzübersicht

Einführung in andere Open-Source-Datensätze

ChemBench-4K-Datensatz

ChemPref-10K-Datensatz

C-MHChem-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

ChemBench4K Benchmark-Datensatz Zur Bewertung Der Chemischen Fähigkeiten

Hintergrund

Datensatzübersicht

Einführung in andere Open-Source-Datensätze

ChemBench-4K-Datensatz

ChemPref-10K-Datensatz

C-MHChem-Datensatz

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

RealTimeFaceSwap-10k Video Call Spoofing Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

ChemBench4K Benchmark-Datensatz Zur Bewertung Der Chemischen Fähigkeiten

Hintergrund

Datensatzübersicht

Einführung in andere Open-Source-Datensätze

ChemBench-4K-Datensatz

ChemPref-10K-Datensatz

C-MHChem-Datensatz

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

RealTimeFaceSwap-10k Video Call Spoofing Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

RealTimeFaceSwap-10k Video Call Spoofing Dataset

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RoVid-X-Roboter-Videogenerierungsdatensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

RealTimeFaceSwap-10k Video Call Spoofing Dataset