HyperAIHyperAI

Command Palette

Search for a command to run...

TransferTransfo: ニューラルネットワークに基づく対話エージェントの転移学習アプローチ

Thomas Wolf Victor Sanh Julien Chaumond Clement Delangue

概要

生成データ駆動対話システム(例:チャットボット)の新しいアプローチであるTransferTransfoについて紹介します。このアプローチは、転移学習に基づく訓練手法と大容量のトランスフォーマー模型を組み合わせたものです。微調整は、複数の非教師あり予測タスクを組み合わせたマルチタスク目的関数を使用して行われます。結果として得られた微調整済みモデルは、メモリ拡張seq2seqや情報検索モデルなどの現在の最先端のエンドツーエンド会話モデルに対して大幅な改善を示しています。プライベートに保有されているConversational Intelligence Challenge 2のPERSONA-CHATデータセットにおいて、このアプローチは新たな最先端の成果を達成し、それぞれ16.28(絶対値で45%向上)、80.7(絶対値で46%向上)、19.5(絶対値で20%向上)というパープレキシティ、Hits@1、F1スコアを記録しました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています