
本研究旨在将草图分类任务扩展到大量类别中。迄今为止,由于收集用于训练的草图是一个缓慢且繁琐的过程,因此一直无法实现大规模的草图识别。为了克服训练数据不足的问题,我们利用了更容易获取的带有标签的自然图像集合。为了解决领域差异问题,我们提出了一种新颖的数据增强技术,该技术专门针对从自然图像训练集中学习草图识别的任务进行了设计。在边缘检测和边缘选择的参数中引入了随机化。自然图像被转换到一个称为“随机二值细边缘”(rBTE)的伪新领域,作为替代自然图像的训练领域使用。通过这种方法,我们展示了将草图识别扩展到比以往使用的类别数量多出2.5倍以上的可能性。为此,我们结合了多个流行的计算机视觉数据集,构建了一个包含874个类别的自然图像数据集。这些类别被选为适合草图识别的对象。为了评估性能,还收集了一个包含393个类别的子集,并且这些类别都有相应的草图。翻訳:本研究は、スケッチ分類タスクを多数のカテゴリに拡大することを目指しています。これまで、訓練用のスケッチを集める作業が遅く、煩雑であるため、大規模なスケッチ認識の試みは阻まれてきました。訓練データ不足の問題を克服するために、我々は取得が容易なラベル付き自然画像のコレクションを利用しました。ドメイン間のギャップを埋めるために、我々は自然画像からスケッチ認識を学習するための訓練セットに特化した新しいデータ拡張技術を提案します。エッジ検出とエッジ選択のパラメータにランダム化が導入されます。自然画像は、「ランダム化されたバイナリ細エッジ」(rBTE)という擬似新ドメインに変換され、このドメインが訓練用として使用されます。これにより、CNNベースのスケッチ認識において、従来よりも2.5倍以上の数のカテゴリを使用して訓練を行うことが可能となりました。この目的のために、複数の人気のあるコンピュータビジョンデータセットを組み合わせて、874つのカテゴリを含む自然画像データセットを作成しました。これらのカテゴリはスケッチ認識に適しているように選ばれています。性能評価のために、393つのカテゴリで構成されるサブセットも収集し、それぞれに対応するスケッチが含まれています。