Particle Transformer für Jet-Tagging

Die Jet-Tagging ist eine kritische und herausfordernde Klassifizierungsaufgabe in der Teilchenphysik. Obwohl tiefes Lernen die Jet-Tagging erheblich verbessert hat, behindert der Mangel an einem groß angelegten öffentlichen Datensatz weitere Fortschritte. In dieser Arbeit stellen wir JetClass vor, einen neuen umfassenden Datensatz für Jet-Tagging. Der JetClass-Datensatz besteht aus 100 Millionen Jets, was etwa zwei Größenordnungen größer ist als bestehende öffentliche Datensätze. Insgesamt werden 10 Arten von Jets simuliert, darunter mehrere bisher für das Tagging nicht untersuchte Typen. Auf Basis des großen Datensatzes schlagen wir eine neue Transformer-basierte Architektur für Jet-Tagging vor, den Particle Transformer (ParT). Durch die Berücksichtigung paarweiser Teilcheninteraktionen im Aufmerksamheitsmechanismus erreicht ParT eine höhere Tagging-Leistung als ein einfacher Transformer und übertrifft den bisherigen Stand der Technik, ParticleNet, deutlich. Die vorab trainierten ParT-Modelle verbessern auch nach Feinabstimmung erheblich die Leistung bei zwei weit verbreiteten Jet-Tagging-Benchmarks. Der Datensatz, der Code und die Modelle sind öffentlich verfügbar unter https://github.com/jet-universe/particle_transformer.