HyperAIHyperAI

Command Palette

Search for a command to run...

Aussagen: Universelle Informationsextraktion aus Tabellen mit großen Sprachmodellen für ESG-KPIs

Lokesh Mishra¹ Sohayl Dhibi¹ Yusik Kim² Cesar Berrospi Ramis¹ Shubham Gupta² Michele Dolfi¹ Peter Staar¹

Zusammenfassung

Umwelt-, soziale und governance-relevante (ESG) Kennzahlen bewerten die Leistung einer Organisation in Themen wie Klimawandel, Treibhausgasemissionen, Wasserverbrauch, Abfallmanagement, Menschenrechte, Vielfalt und Richtlinien. ESG-Berichte vermitteln diese wertvollen quantitativen Informationen durch Tabellen. Leider ist das Extrahieren dieser Informationen aufgrund der hohen Variabilität sowohl in der Tabellenstruktur als auch im Inhalt schwierig. Wir schlagen Statements vor, eine neuartige domänenübergreifende Datenstruktur zur Extraktion von quantitativen Fakten und zugehörigen Informationen. Wir stellen die Übersetzung von Tabellen in Statements als eine neue überwachte Deep-Learning-Aufgabe für die universelle Informationsextraktion vor. Wir führen SemTabNet ein – einen Datensatz mit über 100.000 annotierten Tabellen. Durch die Untersuchung einer Familie von T5-basierten Statement-Extraktionsmodellen erzeugt unser bestes Modell Statements, die 82 % Ähnlichkeit mit dem Grundwahrheitsdatensatz aufweisen (im Vergleich zu einem Baseline-Wert von 21 %). Wir demonstrieren die Vorteile von Statements, indem wir unser Modell auf über 2700 Tabellen aus ESG-Berichten anwenden. Die homogene Natur der Statements ermöglicht es, explorative Datenanalysen auf umfangreichen Informationen in großen Sammlungen von ESG-Berichten durchzuführen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp