
要約
質問・回答型コミュニティサイト(例:StackOverflowやQuora)は、コンテンツの質を維持するため、ユーザーに対し明確なガイドラインの遵守を求めており、その多くはコンテンツの評価にコミュニティによる通報に依存している。しかし、こうした手法には、違反行為の対応が遅延する、経験豊富な正常ユーザーの時間を浪費する、通報の質が低い、新規ユーザーへのフィードバックが抑制されるといった深刻な課題が存在する。こうした問題を解決し、Q&Aサイトにおけるモデレーション作業の自動化を総合的な目標として、本研究では、Q&Aサイトにおける質問について20の品質または主観的側面を予測するモデルの構築を目指す。その実現のため、Google ResearchのCrowdSourceチームが2019年に収集したデータと、本問題に適応した微調整(fine-tuning)を施した事前学習済みBERTモデルを用いた。平均二乗誤差(MSE)を評価指標として用いた結果、2エポックの学習後、モデルは0.046という値を達成したが、その後のエポックでは著しい向上は見られなかった。これらの結果から、簡単な微調整により、少ないデータ量と短い学習時間で高精度なモデルを迅速に構築可能であることが確認された。