17日前

FooDI-ML:食品・飲料・日用品の画像と説明文を含む大規模な多言語データセット

David Amat Olóndriz, Ponç Palau Puigdevall, Adrià Salvador Palau
FooDI-ML:食品・飲料・日用品の画像と説明文を含む大規模な多言語データセット
要約

本稿では、FooDI-MLデータセットを紹介する。このデータセットには、150万以上のユニークな画像と、950万以上の店舗名、製品名、説明文、コレクションセクションが、Glovoアプリケーションから収集されたものである。提供されるデータは、ヨーロッパ、中東、アフリカ、ラテンアメリカの37か国における食品、飲料、日用品のものであり、33の言語をカバーしている。特に、ウクライナ語やカザフ語など、東ヨーロッパおよび西アジア諸国の言語のサンプルが87万件以上含まれており、これまで公に利用可能な視覚言語データセットにおいて、極めて不足していた言語群を補完している。また、スペイン語や英語といった広く話されている言語も含まれている。さらなる研究を支援するため、本データセットでは、テキスト-画像検索および条件付き画像生成という2つのタスクに関するベンチマークを提供している。

FooDI-ML:食品・飲料・日用品の画像と説明文を含む大規模な多言語データセット | 最新論文 | HyperAI超神経