
要約
ジェットタギングは粒子物理学において重要な課題であるが、その達成は困難を伴っています。深層学習はジェットタギングの分野を変革し、性能を大幅に向上させましたが、大規模な公開データセットの不足がさらなる進歩を妨げています。本研究では、ジェットタギング用の新しい包括的なデータセット「JetClass」を紹介します。JetClassデータセットには1億個のジェットが含まれており、既存の公開データセットよりも約2桁大きい规模です。合計10種類のジェットがシミュレーションされており、これまでタギングに未踏のいくつかのタイプも含まれています。大規模なデータセットに基づいて、我々は新たなトランスフォーマー型アーキテクチャであるParticle Transformer(ParT)を提案します。パティクル間の対相互作用を注意機構に組み込むことで、ParTは単純なトランスフォーマーよりも高いタギング性能を達成し、従来の最先端技術であるParticleNetを超える大きなマージンで優れています。事前学習されたParTモデルは微調整されると、2つの広く採用されているジェットタギングベンチマークでの性能も大幅に向上します。データセット、コードおよびモデルはhttps://github.com/jet-universe/particle_transformer で公開されています。