8ヶ月前

監視付き微調整

データセット

AIインフラストラクチャ

アプローチ／フレームワーク

Aru Maekawa Tsutomu Hirao Hidetaka Kamigaito Manabu Okumura

概要

最近、数十億のパラメータを持つデコーダーのみの事前学習大規模言語モデル（LLMs）が、自然言語処理（NLP）のさまざまなタスクに大きな影響を与えています。エンコーダーのみやエンコーダー-デコーダー型の事前学習言語モデルはすでにディスコース解析において効果を示していますが、LLMsがこのタスクでどの程度の性能を発揮できるかについては未だ研究課題となっています。したがって、本論文では、このようなLLMsが修辞構造理論（RST）に基づくディスコース解析にどれほど有益であるかを調査します。ここでは、基本的なトップダウンおよびボトムアップ戦略の解析プロセスをプロンプトに変換し、LLMsが扱えるようにしています。私たちはLlama 2を使用し、パラメータ数が少ないQLoRAで微調整を行いました。RST-DT、Instr-DT、GUMコーパスという3つのベンチマークデータセットでの実験結果は、700億パラメータを持つLlama 2がボトムアップ戦略で最先端（SOTA）の結果を得たことを示しており、その差異は有意でした。さらに、私たちの解析器はRST-DTでの評価でも汎化能力を示し、GUMコーパスで訓練されたにもかかわらず、RST-DTで訓練された既存の解析器と同様の性能を達成しました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

監視付き微調整

データセット

AIインフラストラクチャ

アプローチ／フレームワーク

Aru Maekawa Tsutomu Hirao Hidetaka Kamigaito Manabu Okumura

概要

最近、数十億のパラメータを持つデコーダーのみの事前学習大規模言語モデル（LLMs）が、自然言語処理（NLP）のさまざまなタスクに大きな影響を与えています。エンコーダーのみやエンコーダー-デコーダー型の事前学習言語モデルはすでにディスコース解析において効果を示していますが、LLMsがこのタスクでどの程度の性能を発揮できるかについては未だ研究課題となっています。したがって、本論文では、このようなLLMsが修辞構造理論（RST）に基づくディスコース解析にどれほど有益であるかを調査します。ここでは、基本的なトップダウンおよびボトムアップ戦略の解析プロセスをプロンプトに変換し、LLMsが扱えるようにしています。私たちはLlama 2を使用し、パラメータ数が少ないQLoRAで微調整を行いました。RST-DT、Instr-DT、GUMコーパスという3つのベンチマークデータセットでの実験結果は、700億パラメータを持つLlama 2がボトムアップ戦略で最先端（SOTA）の結果を得たことを示しており、その差異は有意でした。さらに、私たちの解析器はRST-DTでの評価でも汎化能力を示し、GUMコーパスで訓練されたにもかかわらず、RST-DTで訓練された既存の解析器と同様の性能を達成しました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています