Datum

vor 3 Jahren

Größe

15.51 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

Lizenz

Non-Commercial

Tags

Natürliche Sprachverarbeitung

FCGEC steht für Fine-Grained Corpus for Chinese Grammatical Error Correction. Es handelt sich um ein umfangreiches, mehrreferenziertes Textfehlerkorrekturkorpus von Muttersprachlern. Die Datenquelle wird zum Trainieren und Bewerten des Fehlerkorrekturmodellsystems verwendet und besteht hauptsächlich aus Testfragen zu falschen Sätzen von Grund-, Mittel- und Oberstufenschülern sowie aus Nachrichtenaggregations-Websites. Um mehr Methoden zur Referenzänderung für Sätze bereitzustellen und so unterschiedliche Annotationsziele zu erreichen, wird jeder Satz zufällig 2–4 Annotatoren zur Annotation zugewiesen.Wir haben 54.026 Originalsätze aus zwei Datenquellen gesammelt. Nach dem Entfernen doppelter Sätze und dem Herausfiltern problematischer Sätze (wie z. B. abgeschnittener Texte) enthält FCGEC insgesamt 41.340 Sätze.

Zitat

@inproceedings{xu2022fcgec, Titel = „{FCGEC}: Feingranulares Korpus für die Korrektur chinesischer grammatikalischer Fehler“, Autor = „Xu, Lvxiaowei und Wu, Jianwang und Peng, Jiawei und Fu, Jiayu und Cai, Ming“, Buchtitel = „Ergebnisse der Association for Computational Linguistics: EMNLP 2022“, Jahr = „2022“, Herausgeber = „Association for Computational Linguistics“, url = “https://aclanthology.org/2022.findings-emnlp.137”, Seiten = „1900–1918“ }

FCGEC.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 272Gesamtdownloads 611

FCGEC/
- README.md
  1.33 KB
- README.txt
  2.65 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 3 Jahren

Größe

15.51 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

Lizenz

Non-Commercial

Zitat

FCGEC.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 272Gesamtdownloads 611

FCGEC/
- README.md
  1.33 KB
- README.txt
  2.65 KB

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

vor 4 Tagen

SMOL Multilingual Translation Parallel Dataset

vor einem Monat

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

vor 9 Tagen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

FCGEC-Datensatz Zur Erkennung Und Korrektur Chinesischer Grammatikfehler

Zitat

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

FCGEC-Datensatz Zur Erkennung Und Korrektur Chinesischer Grammatikfehler

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

SMOL Multilingual Translation Parallel Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

FCGEC-Datensatz Zur Erkennung Und Korrektur Chinesischer Grammatikfehler

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

SMOL Multilingual Translation Parallel Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

SMOL Multilingual Translation Parallel Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

SMOL Multilingual Translation Parallel Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset