2ヶ月前

TextBox 2.0: 前学習言語モデルを使用したテキスト生成ライブラリ

Tianyi Tang; Junyi Li; Zhipeng Chen; Yiwen Hu; Zhuohao Yu; Wenxun Dai; Zican Dong; Xiaoxue Cheng; Yuhao Wang; Wayne Xin Zhao; Jian-Yun Nie; Ji-Rong Wen
TextBox 2.0: 前学習言語モデルを使用したテキスト生成ライブラリ
要約

テキスト生成に関する研究を促進するため、本論文では事前学習言語モデル(PLMs)の使用に焦点を当てた包括的かつ統一的なライブラリ、TextBox 2.0 を紹介します。包括性を確保するために、当ライブラリは13の一般的なテキスト生成タスクとそれに対応する83のデータセットをカバーし、さらに一般用途、翻訳、中国語、対話、制御可能、蒸留済み、プロンプトベース、軽量のPLMsを含む45のPLMsも取り入れています。また、効率的な訓練戦略4つを実装し、新しいPLMsの事前学習から生成目的4つを提供しています。統一性を確保するために、インターフェースを設計してデータロードから訓練・評価までの一連の研究プロセス全体をサポートしており、各ステップが統一された方法で実行できるようにしています。豊富な機能にもかかわらず、当ライブラリはPython APIやコマンドラインを通じて使いやすい設計となっています。当ライブラリの有効性を検証するために広範な実験を行い、4つの研究シナリオタイプを例示しました。本プロジェクトは以下のリンクで公開されています: https://github.com/RUCAIBox/TextBox.

TextBox 2.0: 前学習言語モデルを使用したテキスト生成ライブラリ | 最新論文 | HyperAI超神経