2ヶ月前
書籍の表紙だけで判断する
Brian Kenji Iwana; Syed Tahseen Raza Rizvi; Sheraz Ahmed; Andreas Dengel; Seiichi Uchida

要約
書籍のカバーは潜在的な読者に情報を伝えますが、その情報はコンピュータにも学習可能でしょうか?本研究では、深層畳み込みニューラルネットワーク(CNN)を用いて、書籍のカバーが提供する視覚的な手がかりに基づいてジャンルを予測することを提案します。本研究の目的は、書籍とそのカバーとの間の関係性が学習可能かどうかを調査することです。しかし、書籍のジャンルを決定することは困難なタスクであり、カバーは曖昧であることが多く、またジャンル自体も広範囲にわたることがあります。それにもかかわらず、我々はCNNが特徴量を抽出し、デザイナーによって定義されたジャンルの背後にあるデザイン規則を学習できることを示しています。機械学習を使用することで、書籍カバーのデザインプロセスに豊富なリソースを持ち込むことができます。さらに、多くのパターン認識タスクに使用できる新しい課題的なデータセットを提示します。