HyperAIHyperAI

Command Palette

Search for a command to run...

DocBERT: 文書分類用のBERT

Ashutosh Adhikari Achyudh Ram Raphael Tang Jimmy Lin

概要

当社の知る限り、本研究はBERTを文書分類に応用した最初の事例を提示するものです。このタスクには、BERTが最も適していないモデルであると思われるいくつかの特徴があります:文法構造はコンテンツカテゴリにおいてそれほど重要ではなく、文書は一般的なBERT入力よりも長くなることが多く、また文書には複数のラベルが付与されることが多いです。しかしながら、我々は単純な分類モデルを使用してBERTが4つの主要データセットで最先端の性能を達成できることを示しています。BERT推論に関連する計算コストを解決するために、BERT-largeから小型双方向LSTMへの知識蒸留を行い、30倍少ないパラメータで複数のデータセットにおいてBERT-baseと同等の性能を達成しました。本論文の主な貢献は、将来の研究の基礎となる改良されたベースラインを提供することです。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
DocBERT: 文書分類用のBERT | 記事 | HyperAI超神経