細粒度視覚分類(Fine-Grained Visual Categorization, FGVC)は、同じサブカテゴリ内での変動が大きく、異なるサブカテゴリ間の変動が小さいという特徴から、困難なタスクである。近年の研究では、専門家による部位ラベル(part annotation)を用いずに、弱教師ありのアプローチによりこの課題に取り組んでいる。その中でも、二重プーリング(bilinear pooling)に基づく手法は、深層特徴間の相互作用を計算する主なアプローチの一つとして高い有効性を示している。しかし、これらの手法は主に特定の1層内の相関に注目しており、複数層間の高次相互作用にはほとんど着目していない。本研究では、複数層からの特徴間における高次相互作用を考慮することで、より区別力の高い細粒度特徴を学習可能であると主張する。これを実現するために、FGVC向けに高次相互作用(High-Order-Interaction, HOI)手法を提案する。本手法では、効率的な層間三重線形プーリング(cross-layer trilinear pooling)を導入し、3つの異なる層間の3次相互作用を計算する。その後、異なる組み合わせによる3次相互作用を統合して最終的な特徴表現を構築する。HOIはより区別力の高い表現を生成でき、注目機構(attention mechanism)および三重損失(triplet loss)という2つの代表的な技術と容易に統合可能であり、その効果を相乗的に高めることができる。4つのFGVCデータセットを用いた広範な実験により、本手法が従来の二重プーリングに基づく手法を大きく上回ることを示し、また、最先端(state-of-the-art)の性能を達成することが確認された。