HyperAI

Finance-Instruct-500k-Datensatz Zum Finanziellen Denken

Datum

vor 4 Tagen

Veröffentlichungs-URL

huggingface.co

Lizenz

Apache 2.0

Kategorien

Download-Hilfe

Finance-Instruct-500k ist ein Datensatz zum Thema Finanzlogik, der für das Training von Sprachmodellen auf höherer Ebene für Finanzaufgaben, Finanzlogik und mehrstufige Dialoge entwickelt wurde.

Der Datensatz enthält mehr als 500.000 hochwertige Daten aus dem Finanzbereich und umfasst die Beantwortung von Finanzfragen, Argumentation, Stimmungsanalyse, Themenklassifizierung, mehrsprachige Named-Entity-Erkennung und Konversations-KI.

Datensatzfunktionen:

  • Mehrrundendialog: Reichhaltiger Dialoginhalt, der das kontextuelle Verständnis und die Argumentationsfähigkeit betont.
  • Vielfältige Datenquellen: Enthält Daten aus mehreren hochwertigen Datensätzen wie Cinder und Sujet-Finance-Instruct-177k.
  • Daten im RAG-Format: Bei der Retrieval Augmentation Generation (RAG)-Aufgabe werden externe Daten vor dem Benutzerfeld angehängt, um das Kontextverständnis zu verbessern.
  • Deduplizierung und Vorverarbeitung: Eliminieren Sie überlappende und unregelmäßige Einträge, um sauberere und qualitativ hochwertigere Daten zu erhalten.
  • XBRL-Tagging: Enthält strukturierte Finanz-Entity-Tags von Financial-NER-NLP für erweiterte Extraktionsaufgaben.