11日前
言語モデルベースのText-to-SQL意味解析における一般化能力の向上:2つのシンプルな意味境界に基づく手法
Daking Rai, Bailin Wang, Yilun Zhou, Ziyu Yao

要約
構文的・ドメイン一般化は、事前学習された言語モデル(LM)に基づく最先端の意味解析器ですら直面する大きな課題である。本研究では、LMの意味解析における一般化性能を向上させるための2つの単純な手法を実証的に検討する。まず、トークンレベルでは、LMのトークナイザーによって生成されたトークンの意味的境界を保持するためのトークン前処理手法を導入する。次に、シーケンスレベルでは、入力と出力の間で対応するコンポーネントの境界を特別なトークンでマークする手法を提案する。2つのテキストからSQLへの意味解析データセットに対する実験結果から、本研究で提案するトークン前処理は単純ながら、構文的およびドメイン一般化の両面でLMの性能を著しく向上させることを示した。また、コンポーネント境界のマーク手法は特に構文的一般化において有効であることが明らかになった。