OceanInstruct Ocean Großes Modell Anweisungsdatensatz
Datum
Größe
Veröffentlichungs-URL
Kategorien

OceanInstruct ist ein umfangreicher Datensatz mit Sprachmodellanweisungen, der speziell für den Bereich der Meereswissenschaften entwickelt wurde. Es enthält 20.000 Anweisungen und soll Trainingsdaten für große Sprachmodelle im Ozeanbereich bereitstellen. Diese Anweisungen decken ein breites Spektrum an meereswissenschaftlichem Wissen ab und stellen sicher, dass das Modell über professionelle Fähigkeiten zur Beantwortung meereswissenschaftlicher Fragen, zur Inhaltserstellung und zur Nutzung verkörperter Unterwasser-Intelligenz verfügt. Der Datensatz wurde zum Trainieren des OceanGPT-Modells verwendet, das bei der Beantwortung meereswissenschaftlicher Fragen, der Inhaltsgenerierung und in anderen Bereichen gute Leistungen erbringt. Das OceanGPT-Modell übertrifft grundlegende Sprachmodelle bei mehreren Aufgaben und zeigt seine Stärke bei der Bewältigung von Meeresaufgaben, die Expertenwissen erfordern.
Dieser Datensatz wurde 2024 von der Zhejiang-Universität als Open Source bereitgestellt. Die zugehörigen Ergebnisse der Studie lauten:OceanGPT: Ein großes Sprachmodell für Aufgaben der Meereswissenschaften".
Die Adresse des Super-Neuro-Berichts lautetAusgewählt für ACL 2024! Die Zhejiang-Universität führt das erste Ozeansprachenmodell OceanGPT ein und lässt damit verkörperte Intelligenz unter Wasser Wirklichkeit werden".
Darüber hinaus schlug OceanBench vor, OceanBench-Datensatz zur Bewertung des Ozeanographie-Benchmarks, ein Benchmark-Evaluierungsdatensatz speziell für ozeanografische Aufgaben. Dieser Datensatz umfasst insgesamt 15 Aufgaben zum Thema Ozean, wie z. B. Fragen- und Antwort- sowie Beschreibungsaufgaben, und zielt darauf ab, die Fähigkeiten großer Sprachmodelle (LLMs) im Bereich der Ozeanographie umfassend zu bewerten. Die Proben in OceanBench werden automatisch aus Seed-Datensätzen generiert und manuell von Experten überprüft, um die Professionalität und Genauigkeit der Daten sicherzustellen.