3ヶ月前

スタックドアンサンブルを用いたタイ語区切りモデルのドメイン適応

{Sarana Nutanong, Ekapol Chuangsuwanich, Raheem Sarwar, Wannaphong Phatthiyaphaibun, Peerat Limkonchotiwat}
スタックドアンサンブルを用いたタイ語区切りモデルのドメイン適応
要約

自然言語処理の多くのタスクと同様に、タイ語の単語区切り(word segmentation)もドメイン依存性を示す。研究者たちは、既存のモデルを新たなドメインに適応させるために転移学習(transfer learning)に依存してきた。しかし、モデルの入力層および出力層のみにアクセス可能な状況、いわゆる「ブラックボックス」の場合には、このアプローチは適用できない。そこで本研究では、スタッキングアンサンブル学習(stacked-ensemble learning)の枠組みに基づいた「フィルタリング・リファイン(filter-and-refine)」手法を提案し、ブラックボックスの制約に対処する。提案手法と最先端モデルおよび転移学習手法を比較する広範な実験を行った結果、本手法が有効なドメイン適応手法であり、転移学習と同等の性能を達成することが示された。