Dhoroni : Exploration des perceptions du changement climatique et de l'environnement en bengali à travers un jeu de données de nouvelles multidimensionnel et le traitement automatique des langues

Le changement climatique pose des défis critiques à l'échelle mondiale, affectant de manière disproportionnée les pays à faible revenu qui manquent souvent de ressources et de représentation linguistique sur la scène internationale. Bien que le Bangladesh soit l'un des pays les plus vulnérables aux impacts du changement climatique, des lacunes subsistent dans les études en langue bengalie (bangla) liées au changement climatique et au traitement automatique du langage naturel (NLP). Pour combler cette disparité, nous présentons Dhoroni, un nouveau jeu de données d'actualités bengalis (bangla) sur le changement climatique et l'environnement, composé de 2300 articles de presse bengalis annotés, offrant plusieurs perspectives telles que l'influence politique, les données scientifiques/statistiques, l'authenticité, la détection de positionnement et la participation des parties prenantes. De plus, nous proposons une analyse exploratoire approfondie de Dhoroni et introduisons la famille BanglaBERT-Dhoroni, un nouveau groupe de modèles baselines pour la détection d'opinions sur le climat et l'environnement en bengali (bangla), affinés sur notre jeu de données. Cette recherche contribue considérablement à améliorer l'accessibilité et l'analyse du discours climatique en bengali (bangla), en abordant des lacunes cruciales en matière de communication et de recherche dans les régions touchées par le changement climatique comme le Bangladesh, qui compte 180 millions d'habitants.