Analyse causale de médiation multiple et applications
Causal mediation analysis with multiple mediators and applications
par Allan JÉROLON sous la direction de Étienne BIRMELÉ et de Flora ALARCON
Thèse de doctorat en Mathématiques. Mathématiques appliquées
ED 386 Sciences Mathematiques de Paris Centre

Soutenue le vendredi 04 décembre 2020 à Université de Paris (2019-....)

Sujets
  • Biomathématiques
  • Causalité
  • Modèles mathématiques

Les thèses de doctorat soutenues à Université de Paris sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

TEL (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Analyse causale de médiation, Ignorabilité séquentielle, Médiateurs multiples, Sélection de variable
Resumé
L'analyse de médiation causale est une méthode statistique permettant d'étudier les mécanismes définissant les relations entre trois entités, la première étant une cause, la deuxième une variable de réponse et la troisième un ensemble de variables intermédiaires, aussi appelés médiateurs. Cette approche est devenue populaire dans différents domaines tels que les biostatistiques, l'épidémiologie et les sciences sociales. Son objectif est de décomposer et quantifier l'effet total d'une cause T sur une variable de réponse Y en un effet direct et un effet indirect à travers le(s)médiateur(s) Mi. Dans un diagramme causal ainsi défini peuvent intervenir des covariables mesurées ou non ayant des effets sur les trois variables T, Y et Mi. Quand plusieurs médiateurs sont impliqués dans le modèle de médiation, il y a trois cas possibles de relation entre ces médiateurs : 1) Les médiateurs sont indépendants conditionnellement au traitement et aux covariables mesurées. 2) Les médiateurs sont dépendants conditionnellement au traitement et aux covariables mesurées sans pour autant que l'un affecte l'autre. 3) Les médiateurs sont liés de façon causale, c'est-à-dire que l'un affecte l'autre. Les contributions de cette thèse portent sur les deux premières configurations. Plus particulièrement, l'état de l'art pour l'estimation des effets indirects individuels des médiateurs est de faire plusieurs analyses de médiation simple en parallèle, un médiateur à la fois. Cette approche conduit à une estimation biaisée de l'effet direct et n'est pas justifiée dans la situation 2) car l'hypothèse nécessaire d'Ignorabilité Séquentielle n'est alors pas vérifiée. Le premier chapitre de la thèse propose de résoudre ce problème par l'estimation de la loi multivariée des médiateurs conditionnellement au traitement et décrit les nouvelles hypothèses sous lesquelles une telle approche est valide. Une méthode d'estimation de l'effet direct et de tous les effets indirects individuels est développée, prenant en compte la corrélation entre les médiateurs. Le second chapitre est dédié à l'analyse de médiation multiple2/6dans le cas où le nombre de médiateurs grandit. Deux stratégies sont explorées. La première repose sur une classification spectrale des médiateurs en blocs indépendants, chaque bloc pouvant être analysé avec l'approche précédente. La seconde, applicable dans des problèmes de grande dimension, repose sur la sélection de médiateurs potentiels à l'aide d'une approche de type Group-LASSO en amont de l'analyse de médiation. Le troisième chapitre présente le packageR multimediate où les trois méthodes précédentes sont implémentées. On y présente l'algorithme d'estimation en fonction des différents types de médiateurs considérés (linéaires, binaires et catégoriels). Le dernier chapitre présente des applications sur des données réelles. D'une part une application en épidémiologie pour quantifier et décomposer l'effet de la thérapie hormonal sur le cancer du sein. D'autre part une application en psychiatrie, où nous analysons les effets des tempéraments affectifs sur l'anorexie mentale