2ヶ月前

Dhoroni: 多角的なニュースデータセットと自然言語処理を用いたベンガル語の気候変動と環境観に関する調査

Azmine Toushik Wasi; Wahid Faisal; Taj Ahmad; Abdur Rahman; Mst Rafia Islam
Dhoroni: 多角的なニュースデータセットと自然言語処理を用いたベンガル語の気候変動と環境観に関する調査
要約

気候変動は世界的に重要な課題をもたらしており、資源や国際舞台での言語的表現が不足している低所得国の影響が特に大きいです。バングラデシュは気候変動の影響に対して最も脆弱な国の一つであるにもかかわらず、気候変動と自然言語処理(NLP)に関連するベンガル語研究には未だギャップが存在しています。この不均衡に対処するため、私たちはDhoroniという新しいベンガル語(ベンガリー)の気候変動および環境ニュースデータセットを紹介します。このデータセットには2300編のアノテーション付きベンガル語ニュース記事が含まれており、政治的影響、科学的/統計的情報、信頼性、立場検出、利害関係者の関与などの複数の視点を提供します。さらに、Dhoroniの詳細な探査分析を行い、ベンガル語用の新たな基線モデルファミリーであるBanglaBERT-Dhoroniファミリーを導入します。これらのモデルは私たちのデータセットで微調整されており、ベンガル語における気候と環境に関する意見検出に向けた革新的な手法を提供します。本研究は、1億8000万人が住むバングラデシュのような気候変動に影響を受けている地域における重要なコミュニケーションと研究のギャップを解消し、ベンガル語(ベンガリー)での気候議論のアクセシビリティと分析を大幅に向上させるのに大きく貢献します。

Dhoroni: 多角的なニュースデータセットと自然言語処理を用いたベンガル語の気候変動と環境観に関する調査 | 最新論文 | HyperAI超神経