Command Palette

Search for a command to run...

1ヶ月前

メモリQA:マルチモーダル記憶を基にしたリコール質問への回答

Hongda Jiang Xinyuan Zhang Siddhant Garg Rishab Arora Shiun-Zu Kuo et al

メモリQA:マルチモーダル記憶を基にしたリコール質問への回答

要約

我々は、以前に蓄積されたマルチモーダルな記憶から視覚コンテンツに関する想起質問に答えるという、現実世界に即した新しいタスク「Memory-QA」を紹介する。このタスクは、タスク指向の記憶の構築、記憶内に含まれる時系列情報および場所情報の効果的な活用、および複数の記憶を統合して想起質問に答える能力といった、特有の課題を伴う。これらの課題に対応するため、記憶特有の拡張、時系列および場所に意識的なマルチシグナル検索、複数記憶を用いたQAのファインチューニングを統合した包括的なパイプライン「Pensieve」を提案する。本研究では、このタスクにおけるさまざまな現実的な課題を示すためのマルチモーダルベンチマークを構築し、Pensieveが最先端の手法を上回る優れた性能を発揮することを示した(QA精度において最大14%の向上)。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
メモリQA:マルチモーダル記憶を基にしたリコール質問への回答 | 論文 | HyperAI超神経