Apprentissage automatique pour l'analyse de données médicales : application à la métabolomique clinique
Machine Learning for the analysis of complex data in medicine : applications to clinical metabolomics and survival data
par Margaux LUCK sous la direction de Nicolas PALLET
Thèse de doctorat en Bioinformatique
ED 563 Médicament, Toxicologie, Chimie, Imageries

Soutenue le vendredi 06 avril 2018 à Sorbonne Paris Cité

Sujets
  • Maladies rénales
  • Métabolomique
  • Porphyries
  • Résonance magnétique du proton

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Recherche de sous-groupe, Classification, Métabolomique, Résonance magnétique nucléaire du proton, Maladie rénale chronique, Porphyries
Resumé
L'exploitation de bases de données massives dans le but d'effectuer des diagnostics, pronostics ou prévisions médicales nécessite des outils informatiques performants. Dans cette thèse nous avons développé des modèles locaux basés sur un algorithme de recherche de sous-groupes en combinaison avec des classifieurs pour la prédiction de données métabolomiques (spectres de résonance magnétique nucléaire du proton d'urines de patients) de la maladie rénale chronique et des porphyries. Les modèles locaux sont aussi performants que des modèles classiquement utilisés comme la régression logistique, les machines à vecteurs de support et les méthodes à base d'arbres de décision. De plus, les règles proposées par notre algorithme de recherche de sous-groupes sont simples, stables et facilement interprétables (exemple, intervalles de concentration de métabolites) conduisant à des hypothèses physiopathologiques plausibles en accord avec les publications existantes. Pour conclure, dans cette thèse nous avons démontré que nos modèles locaux sont compétitifs en termes de pouvoir prédictifs et d'interprétation par rapport à d'autres méthodes plus classiques et cela sur différents jeux de données.