Mots clés |
Séquençage d'ARN en cellule unique, Analyse de données omiques, Grande dimension, Fonctionnalité, Approche supervisée, Cancer, Immunologie, Bioinformatique |
Resumé |
Le séquençage d'ARN en cellule unique (scRNAseq) est une technique jeune. Elle consiste à faire une photographie instantanée des ARN d'une cellule. Après une phase timide d'adoption, son usage s'est généralisé. La richesse de ces données permet de disséquer finement la biologie du vivant, en accédant à des informations telles que l'hétérogénéité d'une population ou la caractérisation différentielle des cellules saines et malades. Cependant, le scRNAseq est à double tranchant. Bien que cela se soit démocratisé, le travail à la paillasse est encore perfectible, car on ne capture que 5 à 20% des ARN. Quant au travail à l'ordinateur, il constitue un défi : les données sont bruitées car immergées dans un espace à grande dimension, et car la capture des ARN est incomplète. La nouveauté du scRNAseq n'a pas encore permis l'émergence de standards d'analyse communs. Au contraire, il y a une explosion des algorithmes. Cependant, il y un schéma consensuel : importation et nettoyage de la matrice d'expression cellules x gènes, normalisation et réduction de dimension. Sur les données en dimensions réduites, on peut faire de la visualisation, de l'agrégation ou de l'inférence de trajectoire. Enfin les groupes sont annotés. Cette dernière étape d'interprétation est particulièrement critique mais souvent biaisée. Je me suis attachée dans ma thèse à deux aspects de l'analyse des données scRNAseq : l'aspect méthodologique, et l'interprétation. J'ai d'abord étudié le bruit dimensionnel, autrement appelé la malédiction de la dimensionnalité. Cette malédiction complique l'analyse en brouillant les différences entre points proches et lointains. L'analyse scRNAseq, qui repose sur la production de graphes de voisinage, va être nécessairement pénalisée par cette malédiction qui déforme les graphes. L'astuce habituelle consiste donc à réduire la dimension. Il existe un autre effet de la malédiction, le phénomène de hubness, qui est aussi nocif, car il déforme le graphe des plus proches voisins. Toutefois ce phénomène peut être corrigé. J'ai évalué la magnitude du phénomène de hub dans les données omiques, ainsi que l'effet de la correction de hub sur la performance de l'analyse scRNAseq. Le phénomène de hub est bien présent, en particulier dans les matrices caractérisées par une grande dimension intrinsèque, et l'analyse de ces jeux de données en particulier bénéficie de la réduction de hub, avec une performance optimale dans l'espace de dimension effective maximale. Bien que cela ne semble être qu'un algorithme de plus dans la jungle déjà existante, c'est surtout le changement de paradigme qui est singulier, puisqu'on modifie conceptuellement une étape consensuelle, la réduction de dimension. Ensuite, je me suis intéressée aux cellules T, d'abord via le prisme des lymphocytes T régulateurs. Ces cellules, définies initialement fonctionnellement, sont difficile à isoler chez l'homme. En partant de l'hypothèse qu'il y a potentiellement décorrélation entre le phénotype et la fonction, j'ai ensuite élargi mon cadre d'étude à l'ensemble des cellules T en questionnant le paradigme de lignée actuel. J'ai adopté une approche supervisée afin de capturer la fonctionnalité des cellules T avec le scRNAseq. A l'aide de modules fonctionnels pré-définis, je peux relier chaque cellule à sa/ses fonction/s. J'ai d'abord prouvé l'apport de cette approche par rapport à un pipeline non supervisé. Ensuite, j'ai caractérisé les différences fonctionnelles entre cellules T issues d'un tissu sain ou cancéreux. Nous avons aussi implémenté cette méthode pour l'analyse de cellules dendritiques de patients souffrant de la Covid-19, après sélection des modules fonctionnels idoines. Cette stratégie peut donc être appliquée pour d'autres types de cellules que les cellules T, d'autres pathologies que le cancer, et même dans un contexte physiologique, afin de cartographier les fonctions des cellules immunitaires. |