2ヶ月前

SeeDS: ゼロショット食品検出のための意味分離型拡散合成器

Pengfei Zhou; Weiqing Min; Yang Zhang; Jiajun Song; Ying Jin; Shuqiang Jiang
SeeDS: ゼロショット食品検出のための意味分離型拡散合成器
要約

食品検出は、食事推奨や飲食モニタリングを含むさまざまなマルチメディアアプリケーションを支援する食品計算の基本的な課題となっています。現実世界のシナリオに対処するためには、訓練中に見られなかった新しい食品オブジェクトを局所化し認識する必要があり、これがゼロショット検出(ZSD)を要求します。しかし、意味属性の複雑さとクラス内の特徴多様性が、細かい食品クラスの区別にZSD手法が直面する課題となっています。この問題に対処するために、我々はゼロショット食品検出(ZSFD)用のSemantic Separable Diffusion Synthesizer(SeeDS)フレームワークを提案します。SeeDSは2つのモジュールで構成されています:Semantic Separable Synthesizing Module(S$^3$M)とRegion Feature Denoising Diffusion Model(RFDDM)。S$^3$Mは、食材や料理から複雑な食品属性の分離された意味表現を学習し、強化された意味情報を通じて識別可能な食品特徴を合成します。RFDDMは新しい拡散モデルを利用して多様な領域特徴を生成し、細かい合成特徴を通じてZSFDを強化します。広範な実験により、提案手法が2つの食品データセット(ZSFooDおよびUECFOOD-256)上で最先端のZSFD性能を持つことが示されました。さらに、SeeDSは一般的なZSDデータセット(PASCAL VOCおよびMS COCO)でも効果性を維持しています。コードとデータセットはhttps://github.com/LanceZPF/SeeDSで入手できます。

SeeDS: ゼロショット食品検出のための意味分離型拡散合成器 | 最新論文 | HyperAI超神経