
要約
技術図面の分析および検索に関する課題に取り組む。まず、デザイン特許図面の認識および検索を目的とした新たな大規模データセット「DeepPatent」を紹介する。本データセットは、画像検索を目的として35万件を超えるデザイン特許図面を提供している。既存のデータセットとは異なり、DeepPatentは図面群内における細粒度な画像検索関連性を提供し、監督信号として異分野間の関連性に依存しない。静止画像の検索モデル訓練におけるベストプラクティスに基づき、ベースラインの深層学習モデル「Patent-Net」を構築した。DeepPatentの細粒度関連性に基づいて学習させたPatent-Netは、他の深層学習手法および古典的なコンピュータビジョン記述子と比較して優れた性能を示した。本研究で新たに提供したこのデータセットおよびベンチマークアルゴリズムを通じて、技術図面の分析および検索がコンピュータビジョン分野における依然として未解決の課題であることを示し、特許図面の検索が実世界のテストベッドとして研究の促進に貢献しうることを実証した。