2ヶ月前

多タスク弱監督による複雑なモデルの学習

Alexander Ratner; Braden Hancock; Jared Dunnmon; Frederic Sala; Shreyash Pandey; Christopher Ré
多タスク弱監督による複雑なモデルの学習
要約

機械学習モデルの複雑さが増すにつれて、大規模な手動ラベル付き訓練データセットの収集は実践において最大の障壁の一つとなっています。代わりに、より安価だがノイジーなラベルを提供する弱い形式の監督がしばしば使用されます。しかし、これらの弱い監督源には多様で未知の精度があり、相関のあるラベルを出力することがあり、異なるタスクや異なる粒度レベルでラベル付けを行うことがあります。私たちは、問題の異なる関連サブタスクに対してラベル付けを行うと見なすことにより、このような弱い監督源を統合およびモデリングするフレームワークを提案します。これをマルチタスク弱監督設定と呼びます。行列補完問題を解くことで、これらのマルチタスク源の精度をその依存構造に基づいて回復させることができることを示しますが、これはラベリングされたデータなしで行うことができ、エンドモデルの訓練に向けたより高品質な監督を提供します。理論的には、この手法を使用して訓練されたモデルの汎化誤差が非ラベリングデータポイント数とともに改善することを示し、タスクと依存構造に関するスケーリング特性も特徴づけました。3つの細かい分類問題において、私たちの手法は伝統的な教師ありアプローチよりも平均20.2ポイント高い精度向上を示し、多数決ベースラインよりも6.8ポイント高く、各タスクを別々にモデリングする既存の弱監督手法よりも4.1ポイント高い精度向上を達成しました。(注:「ノイジー」は「noisy」、「粒度」は「granularity」、「エンドモデル」は「end model」、「汎化誤差」は「generalization error」という専門用語を使用しています。)

多タスク弱監督による複雑なモデルの学習 | 最新論文 | HyperAI超神経