細粒度視覚分類は、同一サブカテゴリ内での大きな変動と、異なるサブカテゴリ間の高い視覚的類似性という課題を抱えながら、類似したサブカテゴリを分類することを目的としている。近年、識別的な領域の意味的パーツを抽出する手法が注目を集めている。しかし、既存の多くは、オブジェクト検出モジュールやアテンション機構を用いて長方形のバウンディングボックスでパーツ特徴を抽出しているため、物体の豊かな形状情報を正確に捉えることが難しいという課題がある。本論文では、細粒度視覚分類を目的とした新しいマルチスケールパーツサンプリングアテンション(Multi-Granularity Part Sampling Attention, MPSA)ネットワークを提案する。まず、異なるスケールのパーツ情報を抽出し、多様な粒度の識別的パーツ特徴によって高レベル特徴表現を強化する新しいマルチグレインパーツリコールブロックを設計した。次に、各グレインレベルにおけるさまざまな形状のパーツ特徴を効果的に抽出するため、特徴マップ上に隠れた意味的パーツを包括的にサンプリング可能な「パーツサンプリングアテンション」を提案する。このアテンションは、サンプリングされたパーツの重要性を考慮するとともに、過学習を低減するためのパーツドロップアウトを導入している。さらに、勾配クラス活性化マップ(gradient class activation map)を活用して、前景特徴を強調し背景ノイズを抑制する新しいマルチグレイン融合手法を提案した。実験結果により、提案手法MPSAは4つの代表的な細粒度視覚分類ベンチマークにおいて、最先端の性能を達成した。ソースコードは、https://github.com/mobulan/MPSA にて公開されている。