
초록
제트 태깅은 입자 물리학에서 중요한데도 불구하고 도전적인 분류 작업입니다. 딥 러닝은 제트 태깅을 혁신적으로 변화시키고 성능을 크게 향상시켰지만, 대규모 공개 데이터셋의 부족으로 인해 추가적인 개선이 저해되고 있습니다. 본 연구에서는 제트 태깅을 위한 새로운 포괄적인 데이터셋인 JetClass를 소개합니다. JetClass 데이터셋은 1억 개의 제트로 구성되어 있으며, 기존의 공개 데이터셋보다 약 두 자릿수 더 큽니다. 총 10종류의 제트가 시뮬레이션되었으며, 이 중 몇몇 종류는 아직까지 태깅에 대해 연구되지 않았습니다.대규모 데이터셋을 바탕으로, 우리는 제트 태깅을 위한 새로운 트랜스포머 기반 아키텍처인 Particle Transformer (ParT)를 제안합니다. ParT는 주의 메커니즘에 쌍별 입자 상호작용을 통합함으로써 평범한 트랜스포머보다 더 높은 태깅 성능을 달성하며, 이전 최고 수준의 모델인 ParticleNet을 크게 능가합니다. 사전 학습된 ParT 모델들은 미세 조정(fine-tuning) 후에도 널리 사용되는 두 가지 제트 태깅 벤치마크에서 성능이 크게 향상됩니다. 데이터셋, 코드 및 모델은 https://github.com/jet-universe/particle_transformer에서 공개적으로 이용 가능합니다.