6ヶ月前

ディープラーニング

ドキュメント理解

アプローチ／フレームワーク

自然言語処理

Andrei Manolache Florin Brad Elena Burceanu

概要

近年、従来の手法に比べて優れた性能を発揮するため、深層学習モデルを用いた異常検出（Anomaly Detection, AD）の応用が広く進展している。画像における異常検出を目的とした最近の深層学習手法は、エンド・トゥ・エンドの自己教師あり学習設定下で、正常なデータのより優れた特徴を学習することができる。これらの手法は、視覚データに適用された異なる変換処理を区別するモデルを学習し、その出力を利用して異常度スコアを算出する。本研究では、テキストシーケンスに対して新たな前処理タスク（pretext task）を導入することで、このアプローチをテキストにおける異常検出に適用した。我々は、トークンレベルとシーケンスレベルの2つの独立的かつ補完的な自己教師信号を強制的に導入することで、エンド・トゥ・エンドでDATEモデルを学習する。この新しいタスク定式化に基づき、20NewsgroupsおよびAG Newsデータセットにおいて、定量的・定性的な優れた結果を示した。半教師あり設定では、最先端手法をそれぞれ+13.5%および+6.9%（AUROC）上回り、無教師設定では、他の手法が0%の外れ値を含む場合と比較して、訓練データの10%が外れ値で汚染された状況でも、すべての既存手法を上回った。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

ディープラーニング

ドキュメント理解

アプローチ／フレームワーク

自然言語処理

Andrei Manolache Florin Brad Elena Burceanu

概要

近年、従来の手法に比べて優れた性能を発揮するため、深層学習モデルを用いた異常検出（Anomaly Detection, AD）の応用が広く進展している。画像における異常検出を目的とした最近の深層学習手法は、エンド・トゥ・エンドの自己教師あり学習設定下で、正常なデータのより優れた特徴を学習することができる。これらの手法は、視覚データに適用された異なる変換処理を区別するモデルを学習し、その出力を利用して異常度スコアを算出する。本研究では、テキストシーケンスに対して新たな前処理タスク（pretext task）を導入することで、このアプローチをテキストにおける異常検出に適用した。我々は、トークンレベルとシーケンスレベルの2つの独立的かつ補完的な自己教師信号を強制的に導入することで、エンド・トゥ・エンドでDATEモデルを学習する。この新しいタスク定式化に基づき、20NewsgroupsおよびAG Newsデータセットにおいて、定量的・定性的な優れた結果を示した。半教師あり設定では、最先端手法をそれぞれ+13.5%および+6.9%（AUROC）上回り、無教師設定では、他の手法が0%の外れ値を含む場合と比較して、訓練データの10%が外れ値で汚染された状況でも、すべての既存手法を上回った。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています