6ヶ月前

自然言語処理

ディープラーニング

マルチタスク学習

アプローチ／フレームワーク

自然言語処理

Wenbiao Li Ziyang Wang Yunfang Wu

概要

可読性評価において、従来の手法は主に数百もの言語的特徴量を用いた機械学習分類器が用いられてきた。一方で、深層学習モデルはほぼすべての自然言語処理（NLP）タスクにおいて主流のアプローチとなっているが、可読性評価への応用はまだ十分に検討されていない。本論文では、特徴量投影（feature projection）と長さバランス損失（length-balanced loss）を組み合わせたBERTベースのモデル（BERT-FP-LBL）を、可読性評価に提案する。特に、トピック特徴を抽出するための新しい難易度知識を活用した半教師あり手法を提示し、従来の言語的特徴量を補完する。また、言語的特徴量から正規直交特徴量を抽出するための投影フィルタリングを採用し、BERTによる表現を補完する。さらに、データの長さ分布が著しく異なる問題に対処するため、新しい長さバランス損失を設計した。本モデルは、2つの英語ベンチマークデータセットおよび中国語教科書データセットにおいて、最先端の性能を達成し、ある英語データセットでは99％に近い正確性（accuracy）を実現した。さらに、一貫性テストにおいて人間の専門家と同等の結果を得ることに成功した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

自然言語処理

ディープラーニング

マルチタスク学習

アプローチ／フレームワーク

自然言語処理

Wenbiao Li Ziyang Wang Yunfang Wu

概要

可読性評価において、従来の手法は主に数百もの言語的特徴量を用いた機械学習分類器が用いられてきた。一方で、深層学習モデルはほぼすべての自然言語処理（NLP）タスクにおいて主流のアプローチとなっているが、可読性評価への応用はまだ十分に検討されていない。本論文では、特徴量投影（feature projection）と長さバランス損失（length-balanced loss）を組み合わせたBERTベースのモデル（BERT-FP-LBL）を、可読性評価に提案する。特に、トピック特徴を抽出するための新しい難易度知識を活用した半教師あり手法を提示し、従来の言語的特徴量を補完する。また、言語的特徴量から正規直交特徴量を抽出するための投影フィルタリングを採用し、BERTによる表現を補完する。さらに、データの長さ分布が著しく異なる問題に対処するため、新しい長さバランス損失を設計した。本モデルは、2つの英語ベンチマークデータセットおよび中国語教科書データセットにおいて、最先端の性能を達成し、ある英語データセットでは99％に近い正確性（accuracy）を実現した。さらに、一貫性テストにおいて人間の専門家と同等の結果を得ることに成功した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています