Command Palette
Search for a command to run...
scSiameseClu : Un cadre d'apprentissage non supervisé par paires pour l'interprétation des données de séquençage à l'unité cellulaire de l'ARN
Ping Xu Zhiyuan Ning Pengjiang Li Wenhao Liu Pengyang Wang Jiaxu Cui Yuanchun Zhou Pengfei Wang

Résumé
Le séquençage de l’ARN à l’échelle d’une seule cellule (scRNA-seq) permet de révéler l’hétérogénéité cellulaire, dans lequel le regroupement cellulaire joue un rôle fondamental pour identifier les types cellulaires et les gènes marqueurs. Les progrès récents, notamment les méthodes basées sur les réseaux de neurones graphiques (GNN), ont considérablement amélioré les performances du regroupement. Toutefois, l’analyse des données scRNA-seq reste difficile en raison du bruit, de la sparsité et de la haute dimensionnalité. Ces difficultés sont exacerbées par le phénomène d’« over-smoothing » fréquent dans les GNN, qui limite leur capacité à capturer des informations biologiques complexes. À cet égard, nous proposons scSiameseClu, un nouveau cadre de regroupement basé sur une architecture Siamese, conçu pour interpréter les données scRNA-seq, composé de trois étapes clés : (1) un module d’augmentation double, qui applique des perturbations biologiquement informées sur la matrice d’expression génique et les relations du graphe cellulaire afin d’améliorer la robustesse des représentations ; (2) un module de fusion Siamese, qui combine un raffinement par corrélation croisée et une fusion d’information adaptative pour capturer des relations cellulaires complexes tout en atténuant le phénomène d’over-smoothing ; et (3) un algorithme de regroupement basé sur le transport optimal, qui utilise la distance de Sinkhorn pour aligner efficacement les affectations de clusters avec des proportions prédéfinies tout en préservant un équilibre. Des évaluations approfondies menées sur sept jeux de données réels montrent que ~\methodname~ surpasse les méthodes de pointe dans le regroupement cellulaire, l’annotation des types cellulaires et la classification des types cellulaires, offrant ainsi un outil puissant pour l’interprétation des données scRNA-seq.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.