
要約
オンラインQ&Aおよびオープンソースコミュニティでは、タグやキーワードを用いて特定のコンテンツをインデックス化・分類・検索しています。タグ推薦の最も顕著な利点は、情報の正確な分類が可能になる点にあります。本研究では、オンラインQ&Aおよびオープンソースコミュニティにおけるタグ推薦タスクに、初めてBERTの事前学習技術を適用しました。freecodeデータセットを用いた評価結果から、本研究で提案する手法(TagBERT)が、従来のディープラーニング手法および他のベースライン手法と比較して、より高い精度を達成することが明らかになりました。さらに、従来の研究で見られた「タグ推薦数を増やすとモデル性能が著しく低下する」という問題を解決することで、本モデルは高い安定性を実現しました。