Datum

vor 2 Jahren

Größe

1.83 MB

Organisation

Veröffentlichungs-URL

github.com

Tags

LLM

Natürliche Sprachverarbeitung

Multi-Task-Lernen

IEPile ist ein umfangreicher, hochwertiger, zweisprachiger (Chinesisch und Englisch) Datensatz zur Feinabstimmung von Anweisungen zur Informationsextraktion (IE), der von der Zhejiang-Universität entwickelt wurde und drei zentrale Teilaufgaben abdeckt: Named Entity Recognition (NER), Relationsextraktion (RE) und Event Extraction (EE). Der Datensatz enthält etwa 2 Millionen Anweisungsbeispiele mit insgesamt etwa 320 Millionen Token, die mehrere Bereiche wie Allgemeinwissen, Medizin und Finanzen abdecken. Das Forschungsteam stellte die hohe Qualität des Datensatzes sicher, indem es 26 englische und 7 chinesische IE-Datensätze sorgfältig integrierte und die vorgeschlagene „schemabasierte Methode zur Erstellung von Polling-Anweisungen“ übernahm, einschließlich der Erstellung eines Wörterbuchs mit schwierigen negativen Stichproben und der Generierung von Polling-Anweisungen. Die Konstruktion von IEPile verbessert die Leistung großer Modelle bei Aufgaben zur Informationsextraktion erheblich, insbesondere die Zero-Shot-Generalisierungsfunktionen, und stellt wertvolle Ressourcen für die Informationsextraktionsforschung bereit.

Zitat

@article{DBLP:journals/corr/abs-2402-14710, Autor = {Honghao Gui und Lin Yuan und Hongbin Ye und Ningyu Zhang und Mengshu Sun und Lei Liang und Huajun Chen}, Titel = {IEPile: Aufdeckung der groß angelegten schemabasierten Informationsextraktion Korpus}, Journal = {CoRR}, Volumen = {abs/2402.14710}, Jahr = {2024}, url = {https://doi.org/10.48550/arXiv.2402.14710}, doi = {10.48550/ARXIV.2402.14710}, eprinttype = {arXiv}, eprint = {2402.14710}, Zeitstempel = {Di., 09. Apr. 2024 07:32:43 +0200}, biburl = {https://dblp.org/rec/journals/corr/abs-2402-14710.bib}, bibsource = {dblp computer science bibliography, https://dblp.org} }

IEPile.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 393Gesamtdownloads 817

IEPile/
- README.md
  1.47 KB
- README.txt
  2.94 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

Global Earthquake-M4.5: Ein Datensatz Von Erdbeben Der Stärke 4,5 Und Höher weltweit.

vor einem Monat

Datensatz Zur Klassifizierung Von Augenkrankheiten Im Fundus

vor einem Monat

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

vor 10 Tagen

MDPBench Multilingual Document Parsing Benchmark Dataset

vor 10 Tagen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Download

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

1.83 MB

Organisation

Veröffentlichungs-URL

github.com

Zitat

IEPile.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 393Gesamtdownloads 817

IEPile/
- README.md
  1.47 KB
- README.txt
  2.94 KB

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

vor 15 Stunden

Wörtliche Spannen Abfragebedingungs-Evidenz-Extraktionsdatensatz

vor 7 Stunden

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

vor 7 Tagen

Movie Feelings-Datensatz

vor 14 Tagen

Verrauschter Datensatz Medizinischer Dokumentenbilder

vor 10 Tagen

TACK Targeted Chimera Knowledge Base Dataset

vor 23 Tagen

SMOL Multilingual Translation Parallel Dataset

vor einem Monat

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

vor 15 Tagen

Caravan Global Community Großer Hydrologischer Datensatz

vor einem Monat

Global Earthquake-M4.5: Ein Datensatz Von Erdbeben Der Stärke 4,5 Und Höher weltweit.

vor einem Monat

Datensatz Zur Klassifizierung Von Augenkrankheiten Im Fundus

vor einem Monat

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

vor 10 Tagen

MDPBench Multilingual Document Parsing Benchmark Dataset

vor 10 Tagen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

IEPile-Korpus Zur Extraktion Umfangreicher Informationen

Zitat

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

IEPile-Korpus Zur Extraktion Umfangreicher Informationen

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

Wörtliche Spannen Abfragebedingungs-Evidenz-Extraktionsdatensatz

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Movie Feelings-Datensatz

Verrauschter Datensatz Medizinischer Dokumentenbilder

TACK Targeted Chimera Knowledge Base Dataset

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

Caravan Global Community Großer Hydrologischer Datensatz

Global Earthquake-M4.5: Ein Datensatz Von Erdbeben Der Stärke 4,5 Und Höher weltweit.

Datensatz Zur Klassifizierung Von Augenkrankheiten Im Fundus

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

MDPBench Multilingual Document Parsing Benchmark Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

IEPile-Korpus Zur Extraktion Umfangreicher Informationen

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

Wörtliche Spannen Abfragebedingungs-Evidenz-Extraktionsdatensatz

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Movie Feelings-Datensatz

Verrauschter Datensatz Medizinischer Dokumentenbilder

TACK Targeted Chimera Knowledge Base Dataset

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

Caravan Global Community Großer Hydrologischer Datensatz

Global Earthquake-M4.5: Ein Datensatz Von Erdbeben Der Stärke 4,5 Und Höher weltweit.

Datensatz Zur Klassifizierung Von Augenkrankheiten Im Fundus

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

MDPBench Multilingual Document Parsing Benchmark Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

Wörtliche Spannen Abfragebedingungs-Evidenz-Extraktionsdatensatz

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Movie Feelings-Datensatz

Verrauschter Datensatz Medizinischer Dokumentenbilder

TACK Targeted Chimera Knowledge Base Dataset

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

Caravan Global Community Großer Hydrologischer Datensatz

Global Earthquake-M4.5: Ein Datensatz Von Erdbeben Der Stärke 4,5 Und Höher weltweit.

Datensatz Zur Klassifizierung Von Augenkrankheiten Im Fundus

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

MDPBench Multilingual Document Parsing Benchmark Dataset

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

Wörtliche Spannen Abfragebedingungs-Evidenz-Extraktionsdatensatz

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Movie Feelings-Datensatz

Verrauschter Datensatz Medizinischer Dokumentenbilder

TACK Targeted Chimera Knowledge Base Dataset

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

Caravan Global Community Großer Hydrologischer Datensatz

Global Earthquake-M4.5: Ein Datensatz Von Erdbeben Der Stärke 4,5 Und Höher weltweit.

Datensatz Zur Klassifizierung Von Augenkrankheiten Im Fundus

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

MDPBench Multilingual Document Parsing Benchmark Dataset