Datum

vor 2 Jahren

Größe

1.11 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

Tags

LLM

Natürliche Sprachverarbeitung

Retrieval-Augmented Generation

Benchmarks

OceanBench ist ein Benchmark-Evaluierungsdatensatz speziell für ozeanografische Aufgaben, der 2024 vom Team von Zhang Ningyu und Chen Huajun von der Zhejiang-Universität entwickelt wurde. Dieser Datensatz umfasst insgesamt 15 Aufgaben zum Thema Ozean, wie z. B. Fragen- und Antwort- sowie Beschreibungsaufgaben, und zielt darauf ab, die Fähigkeiten großer Sprachmodelle (LLMs) im Bereich der Ozeanographie umfassend zu bewerten. Die Proben in OceanBench werden automatisch aus Seed-Datensätzen generiert und manuell von Experten überprüft, um die Professionalität und Genauigkeit der Daten sicherzustellen. OceanBench wurde entwickelt, um die Entwicklung groß angelegter Sprachmodelle in der Ozeanographie voranzutreiben. Es bietet eine standardisierte Testplattform, die Forschern hilft, die Leistung von Modellen bei Aufgaben der Meereswissenschaften besser zu verstehen und zu verbessern. Mithilfe dieses Benchmarks können Forscher die Leistungsfähigkeit von Modellen in verschiedenen Teilaufgaben der Meereswissenschaften bewerten, darunter unter anderem Fragen und Antworten sowie die Generierung von Beschreibungen in den Bereichen Meeresphysik, Meereschemie, Meeresbiologie, Geologie, Hydrologie usw. Darüber hinaus schlug OceanBench vor, OceanInstruct Ocean Großes Modell Anweisungsdatensatz, ein großer Datensatz mit Sprachmodellanweisungen, der speziell für den Bereich der Meereswissenschaften entwickelt wurde. Es enthält 20.000 Anweisungen und zielt darauf ab, Trainingsdaten für große Sprachmodelle im Meeresbereich bereitzustellen. Diese Anweisungen decken ein breites Spektrum an meereswissenschaftlichem Wissen ab und stellen sicher, dass das Modell über professionelle Fähigkeiten zur Beantwortung meereswissenschaftlicher Fragen, zur Inhaltserstellung und zur Nutzung verkörperter Unterwasser-Intelligenz verfügt. Der Datensatz wurde zum Trainieren des OceanGPT-Modells verwendet, das bei der Beantwortung meereswissenschaftlicher Fragen, der Inhaltsgenerierung und in anderen Bereichen gute Leistungen erbringt.

OceanBenchDataset.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 207Gesamtdownloads 341

OceanBenchDataset/
- README.md
  2.15 KB
- README.txt
  4.3 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Download

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

1.11 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

vor 2 Monaten

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

vor 3 Monaten

CL-bench Context Learning Evaluation Benchmark-Datensatz

vor 3 Monaten

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

vor 5 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 5 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 5 Monaten

LongBench-Pro Long Context Comprehensive Evaluation Dataset

vor 5 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

OceanBench-Datensatz Zur Bewertung Des Ozeanographie-Benchmarks

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

OceanBench-Datensatz Zur Bewertung Des Ozeanographie-Benchmarks

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

CL-bench Context Learning Evaluation Benchmark-Datensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

LongBench-Pro Long Context Comprehensive Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

OceanBench-Datensatz Zur Bewertung Des Ozeanographie-Benchmarks

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

CL-bench Context Learning Evaluation Benchmark-Datensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

LongBench-Pro Long Context Comprehensive Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

CL-bench Context Learning Evaluation Benchmark-Datensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

LongBench-Pro Long Context Comprehensive Evaluation Dataset

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

CL-bench Context Learning Evaluation Benchmark-Datensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

LongBench-Pro Long Context Comprehensive Evaluation Dataset