HyperAIHyperAI

Command Palette

Search for a command to run...

関係再帰型ニューラルネットワーク

Adam Santoro*α, Ryan Faulkner*α, David Raposo*α, Jack Raeαβ, Mike Chrzanowskiα, Théophane Weberα, Daan Wierstraα, Oriol Vinyalsα, Razvan Pascanuα, Timothy Lillicrapαβ

概要

メモリベースのニューラルネットワークは、長期間情報を記憶する能力を活用して時系列データをモデル化します。しかし、これらのネットワークが記憶した情報を使って複雑な関係推論を行う能力があるかどうかは明確ではありません。本研究ではまず、標準的なメモリアーキテクチャが実体間のつながりを理解する必要のあるタスク(つまり、関係推論を伴うタスク)で苦戦するという直感を確認します。次に、新しいメモリモジュールである\textit{リレーショナルメモリコア} (RMC) を使用することで、これらの欠点を改善します。RMCはマルチヘッドドット積注意機構を使用してメモリ間の相互作用を可能にします。最後に、RMLが逐次情報におけるより高度な関係推論から利益を得られる可能性のある一連のタスクでテストを行い、強化学習(例:ミニパックマン)、プログラム評価、言語モデル化において大幅な改善が見られることを示しました。WikiText-103、Project Gutenberg、GigaWordデータセットでの最先端の結果を達成しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています