vor 6 Monaten

Zusammenfassung

Wir stellen EQ-Bench vor, einen neuartigen Benchmark, der entwickelt wurde, um Aspekte der emotionalen Intelligenz in großen Sprachmodellen (Large Language Models, LLMs) zu evaluieren. Wir untersuchen die Fähigkeit von LLMs, komplexe Emotionen und soziale Interaktionen zu verstehen, indem wir sie bitten, die Intensität emotionaler Zustände von Charakteren in Dialogen vorherzusagen. Der Benchmark ist in der Lage, eine breite Palette von Modellen effektiv zu unterscheiden. Wir stellen fest, dass EQ-Bench eine starke Korrelation mit umfassenden, mehrdomänenorientierten Benchmarks wie MMLU (Hendrycks et al., 2020) aufweist (r = 0,97), was darauf hindeutet, dass wir möglicherweise ähnliche Aspekte allgemeiner Intelligenz erfassen. Unser Benchmark liefert hochreproduzierbare Ergebnisse anhand einer Sammlung von 60 Fragen in englischer Sprache. Zudem stellen wir den Quellcode für eine automatisierte Benchmarking-Pipeline unter https://github.com/EQ-bench/EQ-Bench sowie eine Leaderboard-Plattform unter https://eqbench.com öffentlich zur Verfügung.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Samuel J. Paech

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Samuel J. Paech

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

EQ-Bench: Ein emotionaler Intelligenz-Test für große Sprachmodelle | Paper | HyperAI

Command Palette

EQ-Bench: Ein emotionaler Intelligenz-Test für große Sprachmodelle

Samuel J. Paech

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

EQ-Bench: Ein emotionaler Intelligenz-Test für große Sprachmodelle

Samuel J. Paech

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

EQ-Bench: Ein emotionaler Intelligenz-Test für große Sprachmodelle

Samuel J. Paech

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters