6ヶ月前

概要

オンラインソーシャルメディアには、誹謗・中傷コメントが多発しており、毎秒数え切れないほどの投稿が生成される中で、それらの自動検出が求められている。このタスクに向けた高品質な人手ラベル付きデータセットの作成は、非攻撃的投稿が攻撃的投稿に比べて著しく多いという状況を踏まえると、困難かつ高コストである。一方、ラベルのないデータは豊富であり、取得が容易かつ安価である。このような状況下では、弱ラベル付きの例を用いて訓練データ量を増加させる自己学習（self-training）手法が有効に活用できる。近年の「ノイズあり」自己学習アプローチは、予測の一貫性を確保し、ノイズデータや敵対的攻撃に対して堅牢性を高めるために、テキストデータ拡張技術を導入している。本研究では、サイズが異なる5種類の事前学習済みBERTアーキテクチャを用い、3種類の異なるテキストデータ拡張手法を用いた、デフォルト自己学習とノイズあり自己学習を比較検証した。2つの攻撃的・中傷的発言（offensive/hate-speech）データセット上で実験を評価した結果、(i) モデルサイズにかかわらず自己学習は一貫して性能向上をもたらし、両データセットで最大+1.5%のF1-macroスコア向上を達成した。一方、(ii) テキストデータ拡張を用いたノイズあり自己学習は、類似の設定では成功例があるものの、攻撃的・中傷的発言領域では、最新のバックトランスレーション（backtranslation）を含む最先端の拡張手法を用いても、デフォルト手法に比べて性能が低下することが明らかになった。

ソースPDF