Genetic stratification based on biological networks in autism spectrum disorders
Stratification génétique des troubles du spectre autistique basée sur des réseaux biologiques
par Yang-Min KIM sous la direction de Thomas BOURGERON et de Guillaume DUMAS
Thèse de doctorat en Génétique, omiques, bioinformatique et biologie des systèmes
ED 474 Frontières de l'Innovation en Recherche et Education

Soutenue le jeudi 03 septembre 2020 à Université Paris Cité

Sujets
  • Bioinformatique
  • Structures génétiques
  • Troubles du spectre de l'autisme

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

TEL (Version intégrale de la thèse (pdf))
Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Autisme, TSA, Reproductibilité en bioinformatique, Stratification clinique, Stratification génétique, Réseaux biologique, Network Based Stratification (NBS), Clustering, Association génotype-phénotype
Resumé
Les troubles du spectre autistique (TSA) sont des troubles neurodéveloppementaux diagnostiqués chez plus de 1% de la population, avec des déficits de communication sociale, des intérêts restreints et des comportements stéréotypés. Malgré ces caractéristiques, les TSA sont très hétérogènes aux niveaux génétique et phénotypique. À ce jour, il n'existe aucun traitement efficace connu pour ces troubles. Au niveau moléculaire, des centaines de gènes sont considérés comme étant associés aux TSA. De plus, la variance des symptômes TSA dépend de facteurs monogéniques, polygéniques et environnementaux. Ce spectre étant complexe, mon projet visait à identifier des sous-groupes homogènes caractérisés par des profils génétiques et cliniques pertinents. Cette stratification des personnes avec autisme est effectuée grâce à un apprentissage non supervisé. Avec le développement des données de séquençage génomique, il est désormais possible de prendre en compte pour des maladies complexes de multiples interactions moléculaires au niveau des voies biologiques plutôt qu'une somme de mutations génétiques multiples. Pour cela, nous avons utilisé une méthode intégrant des réseaux biologiques qui fournissent des informations sur les relations protéiques, i.e. Interaction Protéine-Protéine (PPI). Cette méthode, appelée NBS (Network Based Stratification), a été proposée dans le domaine de la recherche sur le cancer pour stratifier les patients en sous-groupes pertinents par la similitude des profils moléculaires communs de leurs tumeurs. Dans notre étude, nous avons investigué le séquençage de l'exome complet et les données cliniques de 1175 patients avec TSA (1031 males et 144 femelles) qui ont été fournis par la Simons SImplex Collection (SSC). Ma thèse a porté tout d'abord sur la NBS et les problèmes de reproductibilité quand on utilise les données de la littérature sur le cancer (https://doi.org/10.1093/gigascience/giy077). Puis, j'ai établit une stratification clinique de la SSC. Les sous-groupes cliniques obtenus sont caractérisés en fonction de la sévérité des TSA et du niveau cognitif, ce qui confirment des études précédentes. La dernière partie se focalise sur la stratification génétique, ce qui n'a jamais été réalisée dans la recherche des TSA, et vise à examiner comment les patients forment des sous-groupes selon leur profil de mutation. À chaque étape, les analyses cliniques et génétiques (e.g. enrichissement de mutations délétères dans certaines voies biologiques) sont appliqués systématiquement afin d'étudier les intersections entre ces sous-groupes cliniques et génétiques. Les premiers résultats montre à la fois la complexité d'une stratification génétique mais néanmoins pointent vers des sous-groupes génétiques qui doivent cependant être répliqués sur d'autres cohortes. La méthode est actuellement testé pour les données de la SSC mais peut être utilisée pour différents types de donnée via l¿outil d¿open-source en Python (StratiPy). Dans notre étude nous avons montré : i) les difficultés de reproduction de la méthode NBS avec les données originales du cancer malgré le temps et le travail considérablement investis ; ii) les trois groupes cliniques bien déterminés par la stratification sur une large cohorte de TSA ; iii) les associations possibles entre les groupes cliniques et génétiques, ces derniers étant obtenus par stratification génétique à l'aide d'analyses standard et de NBS. Dans la recherche sur les TSA, la méthode NBS peut être considéré comme la première approche "mésoscopique" entre l'étude de liaison de mutations rares (de novo, délétion, duplication) au sein d'un échantillon "microscopique", et l'étude d'association au niveau "macroscopique" aboutissant à un modèle polygénique/omnigénique. Cette approche mésoscopique vise à révéler une perturbation commune dans une voie moléculaire liée à un processus cellulaire chez des individus présentant des mutations dans des voisinages similaires en réseau.