HyperAIHyperAI

Command Palette

Search for a command to run...

Transformerを用いた状況認識の基礎付け

junhyeong Cho*1 [email protected] Youngseok Yoon*1 [email protected] Hyeonjun Lee*2 [email protected] Suha Kwak1,2 [email protected]

概要

Grounded Situation Recognition (GSR) は、注目すべき動作(動詞)を分類するだけでなく、意味的な役割に関連する実体(名詞)とそれらの位置を指定された画像から予測するタスクです。ビジョンタスクにおけるトランスフォーマーの著しい成功に着想を得て、私たちはトランスフォーマーエンコーダー-デコーダー構造に基づく GSR モデルを提案します。当モデルの注意メカニズムは、画像の高レベルな意味特徴を効果的に捉えることで正確な動詞分類を可能にし、またモデルが実体間の複雑で画像依存的な関係を柔軟に対処できるようにすることで名詞分類と位置特定の精度向上に貢献します。私たちのモデルは GSR における最初のトランスフォーマー構造であり、SWiG ベンチマークにおいてすべての評価指標で最先端の性能を達成しています。コードは https://github.com/jhcho99/gsrtr で公開されています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Transformerを用いた状況認識の基礎付け | 記事 | HyperAI超神経