Deep learning for churn prediction
Apprentissage profond pour la prédiction de l'attrition
par Louis GEILER sous la direction de Mohamed NADIF
Thèse de doctorat en Science des données
ED 130 Informatique, Télécommunications et Electronique

Soutenue le mercredi 07 décembre 2022 à Université Paris Cité

Sujets
  • Apprentissage profond
  • Apprentissage supervisé (intelligence artificielle)
  • Clientèle
  • Consommateurs -- Fidélisation
  • Prévision
  • Relations avec la clientèle -- Gestion

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

https://theses.hal.science/tel-04546983 (Version intégrale de la thèse (pdf))
Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Apprentissage supervisé, Apprentissage auto-supervisé, Deep learning, Autoencodeur, Clustering, Attrition
Resumé
Le problème de la prédiction de l'attrition est généralement réservé aux équipes de marketing. Cependant,grâce aux avancées technologiques, de plus en plus de données peuvent être collectés afin d'analyser le comportement des clients. C'est dans ce cadre que cette thèse s'inscrit, plus particulièrement par l'exploitation des méthodes d'apprentissages automatiques. Ainsi, nous avons commencés par étudier ce problème dans le cadre de l'apprentissage supervisé. Nous avons montré que la combinaison en ensemble de la régression logistique, des forêt aléatoire et de XGBoost offraient les meilleurs résultats en terme d'Aire sous la courbe (Are Under the Curve, AUC). Nous avons également montré que les méthodes du type ré-échantillonage jouent uniquement un rôle local et non pas global.Ensuite, nous avons enrichi nos prédictions en prenant en compte la segmentation des clients. En effet, certains clients peuvent quitter le service à cause d'un coût qu'ils jugent trop élevés ou suite à des difficultés rencontrés avec le service client. Notre approche a été réalisée avec une nouvelle architecture de réseaux de neurones profonds qui exploite à la fois les autoencodeur et l'approche desk-means. De plus, nous nous sommes intéressés à l'apprentissage auto-supervisé dans le cadre tabulaire. Plus précisément, notre architecture s'inspire des travaux autour de l'approche SimCLR en modificant l'architecture mean-teacher du domaine du semi-supervisé. Nous avons montré via la win matrix la supériorité de notre approche par rapport à l'état de l'art. Enfin, nous avons proposé d'appliquer les connaissances acquises au cours de ce travail de thèse dans un cadre industriel, celui de Brigad. Nous avons atténué le problème de l'attrition à l'aide des prédictions issues de l'approche de forêt aléatoire que nous avons optimisés via un grid search et l'optimisation des seuils. Nous avons également proposé une interprétation des résultats avec les méthodes SHAP (SHapley Additive exPlanations).