Command Palette

Search for a command to run...

4ヶ月前

AliEdalatによるSemEval-2022 Task 4:微調整された言語モデル、BERT+BiGRU、およびアンサンブルモデルを用いた、優越的で高圧的な言語の検出

{Behnam Bahrak Yadollah Yaghoobzadeh Ali Edalat}

AliEdalatによるSemEval-2022 Task 4:微調整された言語モデル、BERT+BiGRU、およびアンサンブルモデルを用いた、優越的で高圧的な言語の検出

要約

本稿では、SemEval-2022 Task 4「支援的・優越的な言語(PCL)検出」において、AliEdalatチームが採用した手法および得られた結果について報告する。本タスクの目的は、脆弱なコミュニティに対する差別を防止するため、テキスト中のPCLの存在およびPCLのカテゴリを検出することにある。本研究では、PCLの存在を検出するために、微調整済みBigBird、微調整済みMPNet、およびBERT+BiGRUの3つの基本モデルをアンサンブルする手法を採用した。しかし、過学習の影響により、アンサンブルモデルはベースラインモデルよりも性能が劣り、F1スコアは0.3031にとどまった。そこで、提出モデルの問題を解決するための新たなアプローチを提示する。本アプローチでは、PCLの異なるカテゴリを個別に考慮する。各PCLカテゴリの検出にあたって、PCL検出器としての視点からアプローチを実施し、BERT+BiGRUの代わりに微調整済みRoBERTaを用いるモデルを構築した。PCLカテゴリ検出において、本モデルはベースラインを上回り、F1スコア0.2531を達成した。さらに、2つのPCLカテゴリを検出するための新たなモデルを提案し、これらは提出されたモデルを上回る性能を示した。

ベンチマーク

ベンチマーク方法論指標
binary-condescension-detection-on-dpmensemble model (BigBird and MPNet)
F1-score: 55.1
multi-label-condescension-detection-on-dpmensemble model (BigBird, MPNet)
Macro-F1: 31.6

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
AliEdalatによるSemEval-2022 Task 4:微調整された言語モデル、BERT+BiGRU、およびアンサンブルモデルを用いた、優越的で高圧的な言語の検出 | 論文 | HyperAI超神経