7ヶ月前

視覚質問応答

コード生成

アプローチ／フレームワーク

自然言語処理

マルチモーダル

Joseph Suarez Justin Johnson Li Fei-Fei

概要

私たちは、分岐プログラムとそれらを構成する関数を共同で学習するための新しい動的微分推論（Dynamic Differentiable Reasoning: DDR）フレームワークを提案します。これにより、最近の動的アーキテクチャにおいて大きな障害となっていた非微分性が解消されます。当該フレームワークは、2つの設定に適用され、非常にコンパクトでデータ効率の高い2つのアーキテクチャが開発されました：CLEVRビジュアル質問応答用のDDRprogと逆ポーランド記法式評価用のDDRstackです。DDRprogでは、再帰的なコントローラを使用して、基礎となる質問の論理に直接対応するモジュール型ニューラルプログラムを共同で予測し実行します。論理的な分岐処理を行うために、明示的にサブプロセスをフォークします。追加の構造的な監督を効果的に活用することで、部分タスクの一貫性において大幅な改善が見られるとともに、全体的な精度でも若干の向上が達成されました。さらに、RPN設定における構造的監督の利点も示しました：DDRstackでのスタック仮定の導入により、LSTMが失敗するような長い式にも一般化することが可能となりました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

視覚質問応答

コード生成

アプローチ／フレームワーク

自然言語処理

マルチモーダル

Joseph Suarez Justin Johnson Li Fei-Fei

概要

私たちは、分岐プログラムとそれらを構成する関数を共同で学習するための新しい動的微分推論（Dynamic Differentiable Reasoning: DDR）フレームワークを提案します。これにより、最近の動的アーキテクチャにおいて大きな障害となっていた非微分性が解消されます。当該フレームワークは、2つの設定に適用され、非常にコンパクトでデータ効率の高い2つのアーキテクチャが開発されました：CLEVRビジュアル質問応答用のDDRprogと逆ポーランド記法式評価用のDDRstackです。DDRprogでは、再帰的なコントローラを使用して、基礎となる質問の論理に直接対応するモジュール型ニューラルプログラムを共同で予測し実行します。論理的な分岐処理を行うために、明示的にサブプロセスをフォークします。追加の構造的な監督を効果的に活用することで、部分タスクの一貫性において大幅な改善が見られるとともに、全体的な精度でも若干の向上が達成されました。さらに、RPN設定における構造的監督の利点も示しました：DDRstackでのスタック仮定の導入により、LSTMが失敗するような長い式にも一般化することが可能となりました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています