HyperAIHyperAI

Command Palette

Search for a command to run...

KERMIT: シーケンスの生成挿入モデル

William Chan; Nikita Kitaev; Kelvin Guu; Mitchell Stern; Jakob Uszkoreit

概要

私たちは KERMIT を提案します。これは、シーケンスとシーケンス対の生成モデルに向けた単純な挿入ベースの手法です。KERMIT は単一のニューラルネットワークを使用して、同時分布およびその分解(すなわち、周辺分布と条件付き分布)をモデル化します。多くの先行研究とは異なり、データ分布の事前指定された因数分解に依存しません。学習中には、ペアデータ (x,y)(x, y)(x,y) を KERMIT に入力して同時分布 p(x,y)p(x, y)p(x,y) を学習し、任意で非ペアデータ xxxyyy を混ぜて周辺分布 p(x)p(x)p(x)p(y)p(y)p(y) を改良することができます。推論時には、両方向の条件付き分布 p(xy)p(x \mid y)p(xy)p(yx)p(y \mid x)p(yx) にアクセスできます。また、同時分布や周辺分布からサンプリングすることも可能です。このモデルは、直列完全自己回帰デコーディングと並列部分自己回帰デコーディングの両方をサポートしており、後者では実証的に対数的な実行時間を示しています。機械翻訳、表現学習、ゼロショットクローズ型質問応答における実験を通じて、私たちの統合的な手法が特定の問題に依存したアーキテクチャの適応を必要とせずに広範なタスクにおいて専門的な最先端システムと同等またはそれ以上の性能を達成できることが示されています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています