HyperAIHyperAI

Command Palette

Search for a command to run...

事前学習モデルの質問生成におけるテキスト構造知識の統合

Zichen Wu Xin Jia Fanyi Qu Yunfang Wu

概要

近年、事前学習済み言語モデルは質問生成(Question Generation: QG)タスクにおいて大きな成功を収めており、従来のシーケンス・トゥ・シーケンスアプローチを著しく上回っている。しかし、これらの事前学習モデルは入力となる文章をフラットなシーケンスとして扱うため、入力文章のテキスト構造に関する情報を把握できていない。本研究では、QGタスクにおいてテキスト構造を「回答の位置」と「文法的依存関係」の観点からモデル化し、これらの課題に対処するため、回答周辺性モデリングと構文マスクアテンションを提案する。特に、ガウス分布を用いたバイアスを導入した局所性モデリングにより、モデルが回答に隣接する文脈に注目できるようにし、構文構造を質問生成プロセスに反映できるようにするマスクアテンション機構を提案する。SQuADデータセットにおける実験結果から、本研究で提案する二つのモジュールが強力な事前学習モデルProphetNetを上回る性能を発揮することが示され、両者を統合することで最先端の事前学習モデルと競争力のある結果が得られた。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています