7ヶ月前

自然言語処理

ドキュメント理解

監視付き微調整

アプローチ／フレームワーク

自然言語処理

Xiang Dai Sarvnaz Karimi Ben Hachey Cecile Paris

概要

大量の無ラベルデータで事前学習された単語ベクトルと言語モデル（LMs）は、様々な自然言語処理（NLP）タスクの性能を大幅に向上させる可能性があります。しかし、事前学習データとターゲットタスクデータの類似性の測定方法やその影響は、直感に任されることが多いです。本研究では、ソースの事前学習データとターゲットタスクデータ間の類似性を異なる側面から量化的に評価するための3つのコスト効率の高い指標を提案します。これらの指標が30組のデータペアにおいて、事前学習済みモデルが固有表現認識（NER）にどれほど有用かを良好に予測できることを示しています。また、結果は事前学習済みの言語モデルが単語ベクトルよりも効果的かつ予測可能であることを示唆していますが、事前学習データが異なっている場合には単語ベクトルの方が優れていることがわかりました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

自然言語処理

ドキュメント理解

監視付き微調整

アプローチ／フレームワーク

自然言語処理

Xiang Dai Sarvnaz Karimi Ben Hachey Cecile Paris

概要

大量の無ラベルデータで事前学習された単語ベクトルと言語モデル（LMs）は、様々な自然言語処理（NLP）タスクの性能を大幅に向上させる可能性があります。しかし、事前学習データとターゲットタスクデータの類似性の測定方法やその影響は、直感に任されることが多いです。本研究では、ソースの事前学習データとターゲットタスクデータ間の類似性を異なる側面から量化的に評価するための3つのコスト効率の高い指標を提案します。これらの指標が30組のデータペアにおいて、事前学習済みモデルが固有表現認識（NER）にどれほど有用かを良好に予測できることを示しています。また、結果は事前学習済みの言語モデルが単語ベクトルよりも効果的かつ予測可能であることを示唆していますが、事前学習データが異なっている場合には単語ベクトルの方が優れていることがわかりました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

類似性指標を用いたNERの事前学習データ選択 | 記事 | HyperAI超神経