HyperAIHyperAI

Command Palette

Search for a command to run...

LlamBERT:自然言語処理における大規模かつ低コストなデータアノテーション

Bálint Csanády Lajos Muzsai Péter Vedres Zoltán Nádasdy András Lukács

概要

大規模言語モデル(LLM)であるGPT-4やLlama 2などは、自然言語処理(NLP)の多岐にわたるタスクにおいて優れた性能を発揮している。しかし、その利用に伴う高いコストが課題となっている。本研究では、LLMを活用して大規模な未ラベルデータベースの小さなサブセットを自動ラベル付けし、その結果を用いてBERTやRoBERTaなどのトランスフォーマー符号化器のファインチューニングを行う、ハイブリッドアプローチ「LlamBERT」を提案する。この戦略は、IMDbレビューデータセットおよびUMLSメタ・ザウスラスの2つの多様なデータセット上で評価された。その結果、LlamBERTアプローチはわずかに精度に若干の低下を伴うものの、大幅なコスト効率の向上を実現したことが明らかになった。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています