
要約
任意の主題に関する質問に答えることができるコンピュータを構築することは、人工知能の長年の目標であり続けています。最近、質問を論理形式やデータベースクエリにマッピングする方法によって有望な進展が見られました。これらのアプローチは効果的である一方で、大量の人間によるラベル付けデータまたは実践者によって調整された語彙や文法を定義する必要があるというコストが伴います。本論文では、それとは異なり、質問をベクトル表現の特徴空間にマッピングする手法を採用します。これにより、スキーマに依存せずに任意の知識ベースを照会し、文法や語彙を必要とせずに情報を取得することが可能になります。当該手法は、新しい最適化手順により訓練されます。この手順は確率的勾配降下法(Stochastic Gradient Descent)に続き、自動生成および協調生成されたリソースの弱い教師あり学習(Weak Supervision)を使用した微調整ステップを組み合わせています。我々は実験的に示しましたが、モデルはそのノイジーデータから有意義な信号を抽出できることでパラレックス(Paralex)という唯一の類似した弱ラベルデータで訓練可能な既存手法に対して大幅な改善を達成しています。