ソーシャルメディアからファッションのトレンドを抽出する方法:無教師学習をサポートする堅牢なオブジェクト検出器

ソーシャルメディアの普及に伴い、有名人や著名なデザイナー、ファッションインフルエンサーから影響を受けたファッションがデザインと製造のサイクルを短縮しています。しかし、ファッション関連コンテンツの爆発的な増加とユーザー生成のファッション写真の大量存在により、ファッションデザイナーがソーシャルメディア上の写真を精査し、トレンドのファッションをまとめ上げることは困難な作業となっています。これに対応するためには、ソーシャルメディア上のファッション写真を深く解析し、特定の写真から複数のファッションアイテムを局所化および分類することが必要です。MSCOCOなどの物体検出コンペティションでは各物体カテゴリに対して数千ものサンプルがありますが、ファストファッションアイテムの大規模ラベル付きデータセットを得るのは非常に難しいです。さらに、最先端の物体検出器には、ソーシャルメディア上に豊富にある未ラベルデータを取り込む機能がなく、ラベル付きデータセットで微調整を行うことが困難です。本研究では、事前学習を無教師学習で行うことができる汎用的な物体検出器を用いて、最近公開されたOpen Images V4データセットからの24カテゴリーに対する応用を示します。まず、ソーシャルメディアから収集した24カテゴリーの60,000枚の未ラベル写真を使用して物体検出器の基本アーキテクチャを無教師学習で訓練します。その後、Open Images V4データセットからの8,200枚のラベル付き写真で微調整を行います。300 x 300ピクセルの画像入力に対しては、2,400枚のテストデータセット上で72.7%のmAP(平均精度)を達成しており、最先端の物体検出器と比較して11%から17%高い性能を示しています。この改善は、無教師学習を行うことができ且つ小さな物体を見分ける能力が著しく優れている当方選択したアーキテクチャによるものであることを示しています。