Datum

vor 2 Jahren

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

Tags

Natürliche Sprachverarbeitung

Dieses Repository enthält Daten und Auswertungsskripte für den HalluQA-Benchmark (Chinese Halluciated Question Answering). Die vollständigen Daten von HalluQA befinden sich in HalluQA.json. Das Papier zur Einführung von HalluQA und detaillierte experimentelle Ergebnisse mehrerer großer Sprachmodelle für Chinesisch sind verfügbar unterHier. HalluQA enthält 450 sorgfältig gestaltete, kontroverse Fragen, die mehrere Bereiche abdecken und die chinesische historische Kultur, Bräuche und soziale Phänomene berücksichtigen.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor 2 Jahren

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor 2 Jahren

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

HalluQA Chinesischer Datensatz Zur Bewertung Großer Halluzinationsmodelle

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

HalluQA Chinesischer Datensatz Zur Bewertung Großer Halluzinationsmodelle

DRACO Cross-Domain Deep Research Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

HalluQA Chinesischer Datensatz Zur Bewertung Großer Halluzinationsmodelle

DRACO Cross-Domain Deep Research Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

DRACO Cross-Domain Deep Research Benchmark-Datensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz