6ヶ月前

監視付き微調整

アプローチ／フレームワーク

Bálint Csanády Lajos Muzsai Péter Vedres Zoltán Nádasdy András Lukács

概要

大規模言語モデル（LLM）であるGPT-4やLlama 2などは、自然言語処理（NLP）の多岐にわたるタスクにおいて優れた性能を発揮している。しかし、その利用に伴う高いコストが課題となっている。本研究では、LLMを活用して大規模な未ラベルデータベースの小さなサブセットを自動ラベル付けし、その結果を用いてBERTやRoBERTaなどのトランスフォーマー符号化器のファインチューニングを行う、ハイブリッドアプローチ「LlamBERT」を提案する。この戦略は、IMDbレビューデータセットおよびUMLSメタ・ザウスラスの2つの多様なデータセット上で評価された。その結果、LlamBERTアプローチはわずかに精度に若干の低下を伴うものの、大幅なコスト効率の向上を実現したことが明らかになった。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

監視付き微調整

アプローチ／フレームワーク

Bálint Csanády Lajos Muzsai Péter Vedres Zoltán Nádasdy András Lukács

概要

大規模言語モデル（LLM）であるGPT-4やLlama 2などは、自然言語処理（NLP）の多岐にわたるタスクにおいて優れた性能を発揮している。しかし、その利用に伴う高いコストが課題となっている。本研究では、LLMを活用して大規模な未ラベルデータベースの小さなサブセットを自動ラベル付けし、その結果を用いてBERTやRoBERTaなどのトランスフォーマー符号化器のファインチューニングを行う、ハイブリッドアプローチ「LlamBERT」を提案する。この戦略は、IMDbレビューデータセットおよびUMLSメタ・ザウスラスの2つの多様なデータセット上で評価された。その結果、LlamBERTアプローチはわずかに精度に若干の低下を伴うものの、大幅なコスト効率の向上を実現したことが明らかになった。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

LlamBERT：自然言語処理における大規模かつ低コストなデータアノテーション | 記事 | HyperAI超神経