Automated detection of galaxy mergers using cosmological simulations and deep learning
Détection automatisée des fusions de galaxies à l'aide de simulations cosmologiques et d'apprentissage profond
par Fernando CARO ARIAS sous la direction de Marc HUERTAS-COMPANY
Thèse de doctorat en Physique
ED 127 Astronomie et astrophysique d'Île-de-France

Soutenue le lundi 17 décembre 2018 à Sorbonne Paris Cité

Sujets
  • Apprentissage profond
  • Galaxies
  • Galaxies -- Évolution
  • Simulation par ordinateur

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

https://theses.hal.science/tel-04923254 (Version intégrale de la thèse (pdf))
Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Fusions de galaxies, Evolution de galaxies, Apprentissage profond
Resumé
Une des principales prédictions dérivées de la cosmologie Λ-CDM est que la structure se développe de manière hiérarchique à la suite de l'assemblage gravitationnel des halos de matière noire et des galaxies qu'ils hébergent, ce qui fait des fusions de galaxies un élément fondamental dans la cadre actuel de l'évolution des galaxies. Malgré cela, le rôle spécifique que jouent les fusions de galaxies dans les différents processus observés dans l'évolution des galaxies, ainsi que les taux estimés, à partir d'observations ou des simulations, ne sont pas entièrement compris. À cet égard, le développement de méthodes précises pour détecter les fusions de galaxies est extrêmement utile pour améliorer notre compréhension de ce processus, mais aussi pour mettre en accord les modèles de formation de galaxies avec les observations disponibles.Inspirés par le succès récent de l'utilisation de plusieurs techniques d'apprentissage profond pour résoudre différents problèmes astrophysiques, nous présentons une nouvelle méthode basée sur l'utilisation des réseaux de neurones convolutifs (en anglais CNN) et de la simulation cosmologique Horizon-AGN pour identifier les fusions de galaxies de manière automatisée et précise. L'idée principale de cette méthode consiste à générer de grands ensembles d'entraînement avec des observations panchromatiques simulées de type HST de fusions de galaxies, de galaxies isolées (non-fusions) et d'effets de projection (fausses fusions), en utilisant les galaxies virtuelles de la simulation Horizon-AGN, qui servent ensuite pour l'entraînement d'une CNN capable d'identifier les fusions de galaxies. Ces observations simulées sont générées en considérant des galaxies massives (M* ¿ 1010M) dans le redshift compris entre 0.5 < z < 3.5, et dans le cas des fusions de galaxies, seules celles correspondant aux fusions majeures (rapport de masse stellaire ¿ 1:4) sont prises en compte.Deux expériences ont été réalisées pour évaluer la performance de cette procédure de détection des fusions de galaxies. Dans le premier cas, nous analysons la performance de la méthode lorsqu'elle est utilisée pour classer des images entre fusions et non-fusions dans un échantillon d'images qui ne comprend que ces deux catégories. Dans le second cas, nous étudions le comportement de la méthode à l'aide d'un échantillon qui comprend également de fausses fusions. Dans les deux cas, trois groupes d'images différents sont considérés en termes de le RSB. Dans le premier groupe, seules les images sans bruit sont incluses, tandis que dans les deuxième et troisième groupes, les images avec un bruit HST réel sont prises en compte, mais où la magnitude F160W est respectivement d'au moins 23 et 24.Dans le cas de la première expérience, on obtient une pureté de 83% et une complétude de 88% dans le cas sans bruit. Pour la classification des images avec bruit, une pureté de 79% et une complétude de 82% sont obtenues pour le cas avec une coupure de magnitude de F160W < 23, tandis qu'une pureté de 71% et une complétude de 72% sont atteintes pour le cas avec une coupure de magnitude de F160W < 24. Dans le cas de la deuxième expérience, une pureté de 88% est atteinte avec une complétude de 86% dans le cas sans bruit. Pour la classification des images avec bruit, une pureté de 85% et une complétude de 82% sont obtenues pour le cas avec une coupure de magnitude de F160W < 23, tandis qu'une pureté de 80% et une complétude de 74% sont atteintes pour le cas avec une coupure de magnitude de F160W < 24. Ces résultats surpassent non seulement les approches classiques basées sur les morphologies non paramétriques qui sont utilisées pour identifier les fusions de galaxies, telles que CAS et G-M20, mais également les versions