2ヶ月前

文:大規模言語モデルを用いた表からのESG KPIの普遍的情報抽出

Lokesh Mishra; Sohayl Dhibi; Yusik Kim; Cesar Berrospi Ramis; Shubham Gupta; Michele Dolfi; Peter Staar
文:大規模言語モデルを用いた表からのESG KPIの普遍的情報抽出
要約

環境、社会、ガバナンス(ESG)のKPI(Key Performance Indicators)は、組織が気候変動、温室効果ガス排出量、水使用量、廃棄物管理、人権、多様性、および政策などの問題におけるパフォーマンスを評価します。ESGレポートでは、この貴重な定量的情報を表形式で伝達しています。しかし、表の構造や内容に大きな変動があるため、これらの情報の抽出は困難です。本研究では、定量的事実と関連情報を抽出するための新しいドメイン非依存型データ構造である「Statements」を提案します。また、表をStatementsに翻訳することを新たな教師あり深層学習による普遍的な情報抽出タスクとして提案します。私たちはSemTabNetという10万件以上のアノテーション付き表からなるデータセットを紹介します。T5ベースのStatement Extraction Modelの系列を調査し、最良のモデルは基準モデル(21%)と比較して82%の類似度を持つStatementsを生成しました。私たちは2700件を超えるESGレポートからの表にモデルを適用することでStatementsの利点を示しています。Statementsの均質性により、大規模なESGレポート収集体において広範な情報に対する探索的データ分析が可能になります。

文:大規模言語モデルを用いた表からのESG KPIの普遍的情報抽出 | 最新論文 | HyperAI超神経