2달 전
Dhoroni: 다각도 뉴스 데이터셋과 자연어 처리를 활용한 벵골 기후 변화 및 환경 인식 탐구
Azmine Toushik Wasi; Wahid Faisal; Taj Ahmad; Abdur Rahman; Mst Rafia Islam

초록
기후 변화는 전 세계적으로 중요한 도전 과제를 제기하며, 자원과 국제 무대에서의 언어적 표현이 부족한 저소득 국가들에게 비례하지 않게 영향을 미치고 있습니다. 방글라데시가 기후 영향에 가장 취약한 국가 중 하나임에도 불구하고, 방골어(번갈어)로 된 기후 변화 및 자연어 처리(NLP) 관련 연구에는 여전히 틈새가 존재합니다. 이러한 불균형을 해결하기 위해, 우리는 Dhoroni라는 새로운 방골어(번갈어) 기후 변화 및 환경 뉴스 데이터셋을 소개합니다. 이 데이터셋은 2,300개의 주석이 달린 번갈어 뉴스 기사로 구성되어 있으며, 정치적 영향, 과학/통계적 데이터, 진실성, 입장 검출, 이해관계자 참여 등 다양한 관점을 제공합니다. 또한, Dhoroni에 대한 심층 탐색 분석을 제시하고, 방골어(번갈어)로 된 기후 및 환경 의견 검출을 위한 새로운 베이스라인 모델 가족인 BanglaBERT-Dhoroni 가족을 소개합니다. 이 모델은 우리의 데이터셋으로 세부 조정되었습니다. 본 연구는 방골어(번갈어)로 된 기후 논의의 접근성과 분석성을 크게 향상시키며, 방글라데시와 같은 기후 영향 지역에서 중요한 의사소통과 연구 틈새를 해결하는 데 크게 기여할 것입니다. 방글라데시는 1억 8천만 명의 인구를 보유하고 있습니다.