Understanding the sequence determinants of guide RNAs for the activity of dCas9 in bacteria
Étude de l'impact de la séquence des ARN guides sur l'activité de dCas9 chez les bactéries
par Alicia CALVO-VILLAMAÑÁN sous la direction de David BIKARD
Thèse de doctorat en Génétique, omiques, bioinformatique et biologie des systèmes
ED 474 Frontières de l'Innovation en Recherche et Education

Soutenue le vendredi 28 mai 2021 à Université Paris Cité

Sujets
  • Bactéries
  • CRISPR-Cas9
  • Expression génique

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

https://theses.hal.science/tel-04509187 (Version intégrale de la thèse (pdf))
Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
CRISPR, DCas9, Contrôle de l'expression génique, Model, ARN guide, Bactéries
Resumé
Ces dernières années, des outils dérivés du système immunitaire bactérien CRISPR-Cas9 ont été utilisés pour diverses applications biotechnologiques. La protéine Cas9 est une nucléase guidée par un petit ARN qui peut être programmée pour cibler n'importe quelle séquence d'intérêt. Chez les bactéries, il peut être utilisé pour introduire des modifications génétiques ou tuer spécifiquement des bactéries pathogènes, tandis que le mutant catalytique de Cas9 (dCas9) peut être utilisé pour contrôler l'expression des gènes. Cependant, tous les ARN guides ne fonctionnent pas de manière égale et il est essentiel de choisir le bon guide avec lequel travailler. Le but de cette thèse est de décrire en détail l'effet de la séquence du guide et de la cible sur l'activité de dCas9 chez les bactéries. Premièrement, en analysant des données de criblage obtenues précédemment chez E. coli, nous avons construit un modèle pour prédire l'activité des ARN guides pour dCas9. Ce jeu de donnée est cependant trop petit pour effectuer une étude approfondie. Deuxièmement, pour explorer pleinement l'espace des séquences, nous avons conçu une nouvelle construction génétique qui permet le criblage de grandes bibliothèques de séquences dont nous avons un contrôle complet. Cela permettra de mesurer l'activité de 100 000 paires de séquences guide et cibles, grâce au séquençage de nouvelle génération. Avec ces données, nous entraînons des modèles d'apprentissage automatique pour prédire l'activité d'un guide dans E. coli et découvrir les déterminants de séquence de dCas9. Troisièmement, nous utilisons la même construction génétique pour explorer l'effet de l'introduction de mésappariements entre l'ARN guide et la cible. Cette technique permet différentes forces de répression de l'expression génique. En utilisant ces données, nous formons des modèles séparés pour explorer cette technique plus en profondeur et pour être en mesure de prédire la force de la répression qu'une paire ARN guide-cible mésappariée aura. Ce projet permet de mieux comprendre l'activité de dCas9 chez les bactéries et contribue à rendre les outils CRISPR-Cas9 plus fiable, aidant ainsi grandement à l'étude des bactéries pathogènes et au développement de nouvelles stratégies antimicrobiennes.