16日前

コミュニティ型質問応答サイトにおけるモデレーション行動の提案のためのマルチビュー手法

{Mohammadamin Fazli, Jafar Habibi, Issa Annamoradnejad}
要約

毎日数千件もの新しい質問が人気のあるQ&Aサイトに投稿される中で、手動によるモデレーションを代替する自動的かつ高精度なソフトウェアソリューションの導入が不可欠となっている。本稿では、Q&Aコミュニティにおけるクラウドソーシングによるモデレーション作業の重大な欠点に着目し、最新の機械学習モデルを活用したモデレーションの自動化の可能性を示す。技術的な観点から、質問を3つの異なる視点から分析する3つの特徴群を生成するマルチビュー手法を提案する。具体的には、1)BERTを基盤とする回帰モデルを用いた質問関連特徴の抽出、2)名前付きエンティティ認識(NER)モデルを用いた文脈関連特徴の抽出、および3)統計的・分析的手法により導出される一般的な語彙的特徴である。最後に、これらの特徴を用いて勾配ブースティング分類器を訓練し、モデレーション行動を予測する。評価のため、Stack Overflowの6万件の質問から構成され、3つのモデレーション行動に分類された新しいデータセットを構築した。新データセットにおける交差検証の結果、本手法は多クラス分類タスクにおいて95.6%の精度を達成し、既存の最先端モデルおよび過去に発表されたすべてのモデルを上回った。本研究の結果は、特徴生成コンポーネントが分類器全体の性能に与える大きな影響を明確に示している。

コミュニティ型質問応答サイトにおけるモデレーション行動の提案のためのマルチビュー手法 | 最新論文 | HyperAI超神経