17日前

簡単な道を選ばない:既知のデータセットバイアスを回避するためのアンサンブルベース手法

Christopher Clark, Mark Yatskar, Luke Zettlemoyer
簡単な道を選ばない:既知のデータセットバイアスを回避するためのアンサンブルベース手法
要約

最先端のモデルは、しばしばデータ内の表面的なパターンに依存しており、ドメイン外や敵対的設定においては一般化能力が低い。例えば、テキスト含意(textual entailment)モデルは、文脈にかかわらず特定のキーワードが含意を示すと学習してしまう傾向があり、視覚質問応答(visual question answering)モデルは画像内の証拠を考慮せずに、典型的な回答を予測する傾向がある。本論文では、このようなバイアスに関する事前知識が得られれば、モデルのドメインシフトに対するロバスト性を向上させられることを示す。本手法は2段階で構成される:(1) データセットのバイアスにのみ依存して予測を行う単純なモデルを訓練し、(2) その単純モデルとアンサンブルを形成する形で、より一般化しやすい他のデータパターンに注目するよう促すロバストなモデルを訓練する。ドメイン外のテストセットを備えた5つのデータセットにおける実験結果から、すべての設定において顕著なロバスト性の向上が確認された。特に、変化する事前知識を伴う視覚質問応答データセットでは12ポイント、敵対的質問応答テストセットでは9ポイントの性能向上が得られた。

簡単な道を選ばない:既知のデータセットバイアスを回避するためのアンサンブルベース手法 | 最新論文 | HyperAI超神経