
オンライン教育プラットフォームは、学習の階層的な分類体系(科目-章-トピック)に基づいて学術的な質問を整理しています。既存の分類体系に新しい質問を自動的にタグ付けすることで、これらの質問を異なる階層的な分類クラスに整理し、章などのファセットに基づいて検索できるようになります。この課題は、フラットな多クラス分類問題として定式化することができます。通常、フラット分類に基づく方法では、階層的な分類体系内の用語と質問との意味的関連性が無視されます。また、伝統的な方法の中には、階層を無視して葉ノードのみを考えることでクラスの不均衡問題に苦しむものもあります。したがって、私たちはこの問題を意味的関連性に基づく検索課題として定式化し、分類体系と質問の間の意味的関連性を最適化します。私たちの方法が未見ラベルの処理に役立つことを示し、その結果、野生環境での分類体系タグ付けに使用可能であることを証明しました。この方法では、質問に対応する回答を追加してより多くの意味的情報を捉え、その後、質問-回答ペアの文脈化された埋め込み表現を対応するラベル(分類体系)ベクトル表現と合わせます。表現は、コサイン類似度とヒンジランク損失の組み合わせを使用した損失関数で微調整されたトランスフォーマーベースモデルによって合わせられます。損失関数は、質問-回答ペアと正解ラベル表現との間の類似度を最大化し、非関連ラベルとの間の類似度を最小化します。最後に、2つの実世界データセットで実験を行いました。提案された学習方法が多クラス分類法や他の最先端手法よりも6%高いRecall@k値で性能を上回ることを示しました。また、ネットワークの再学習なしに関連する未見学習コンテンツ(例えば学習目標)での提案手法の性能も示しています。注:「野生環境」は一般的には「wild」から派生した表現ですが、「実際の利用環境」や「未知のデータに対する適用」などとも解釈できます。文脈により適切な翻訳を選択してください。