7ヶ月前

ディープラーニング

コンピュータビジョン

モデル学習

アプローチ／フレームワーク

コンピュータビジョン

Antti Tarvainen; Harri Valpola

概要

最近提案されたTemporal Ensemblingは、いくつかの半教師あり学習のベンチマークで最先端の結果を達成しています。この手法は各訓練サンプルに対するラベル予測の指数移動平均を維持し、そのターゲットと一貫性がない予測に対して罰則を与えます。しかし、ターゲットがエポックごとに一度しか変更されないため、大規模データセットの学習ではTemporal Ensemblingが扱いづらくなります。この問題を克服するために、私たちはモデルの重みを平均化する方法であるMean Teacherを提案します。追加的な利点として、Mean Teacherはテスト精度を向上させ、Temporal Ensemblingよりも少ないラベルで学習を可能にします。ネットワークアーキテクチャを変更せずに、SVHNデータセットにおいて250ラベルを使用した場合、Mean Teacherは4.35%の誤認識率を達成し、1000ラベルを使用して訓練されたTemporal Ensemblingを上回ります。また、良いネットワークアーキテクチャが性能にとって重要であることを示しています。Mean TeacherとResidual Networks（残差ネットワーク）を組み合わせることで、CIFAR-10データセットにおいて4000ラベルを使用した場合の最良記録を10.55%から6.28%に改善し、ImageNet 2012データセットにおいてラベル数の10%を使用した場合の最良記録を35.24%から9.11%に改善しました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

ディープラーニング

コンピュータビジョン

モデル学習

アプローチ／フレームワーク

コンピュータビジョン

Antti Tarvainen; Harri Valpola

概要

最近提案されたTemporal Ensemblingは、いくつかの半教師あり学習のベンチマークで最先端の結果を達成しています。この手法は各訓練サンプルに対するラベル予測の指数移動平均を維持し、そのターゲットと一貫性がない予測に対して罰則を与えます。しかし、ターゲットがエポックごとに一度しか変更されないため、大規模データセットの学習ではTemporal Ensemblingが扱いづらくなります。この問題を克服するために、私たちはモデルの重みを平均化する方法であるMean Teacherを提案します。追加的な利点として、Mean Teacherはテスト精度を向上させ、Temporal Ensemblingよりも少ないラベルで学習を可能にします。ネットワークアーキテクチャを変更せずに、SVHNデータセットにおいて250ラベルを使用した場合、Mean Teacherは4.35%の誤認識率を達成し、1000ラベルを使用して訓練されたTemporal Ensemblingを上回ります。また、良いネットワークアーキテクチャが性能にとって重要であることを示しています。Mean TeacherとResidual Networks（残差ネットワーク）を組み合わせることで、CIFAR-10データセットにおいて4000ラベルを使用した場合の最良記録を10.55%から6.28%に改善し、ImageNet 2012データセットにおいてラベル数の10%を使用した場合の最良記録を35.24%から9.11%に改善しました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています