KPConvX : Modernisation de la convolution de points noyaux avec l'attention de noyau

Dans le domaine de la compréhension profonde des nuages de points, KPConv est une architecture unique qui utilise des points noyaux pour localiser les poids de convolution dans l'espace, plutôt que de s'appuyer sur des codages par perceptrons multicouches (MLP). Bien qu'elle ait initialement connu un succès, elle a depuis été surpassée par des réseaux MLP récents qui intègrent des conceptions et des stratégies d'entraînement actualisées. En nous appuyant sur le principe des points noyaux, nous présentons deux nouvelles conceptions : KPConvD (KPConv en profondeur), une conception plus légère qui permet l'utilisation d'architectures plus profondes, et KPConvX, une conception innovante qui ajuste les poids de convolution en profondeur de KPConvD avec des valeurs d'attention de noyau. En utilisant KPConvX avec une architecture moderne et une stratégie d'entraînement actuelle, nous sommes en mesure de surpasser les approches actuelles les plus avancées sur les jeux de données ScanObjectNN, Scannetv2 et S3DIS. Nous validons nos choix de conception à travers des études d'ablation et mettons notre code et nos modèles à disposition.