Mots clés |
Recherche de sous-groupe, Classification, Métabolomique, Résonance magnétique nucléaire du proton, Maladie rénale chronique, Porphyries |
Resumé |
L'exploitation de bases de données massives dans le but d'effectuer des diagnostics, pronostics ou prévisions médicales nécessite des outils informatiques performants. Dans cette thèse nous avons développé des modèles locaux basés sur un algorithme de recherche de sous-groupes en combinaison avec des classifieurs pour la prédiction de données métabolomiques (spectres de résonance magnétique nucléaire du proton d'urines de patients) de la maladie rénale chronique et des porphyries. Les modèles locaux sont aussi performants que des modèles classiquement utilisés comme la régression logistique, les machines à vecteurs de support et les méthodes à base d'arbres de décision. De plus, les règles proposées par notre algorithme de recherche de sous-groupes sont simples, stables et facilement interprétables (exemple, intervalles de concentration de métabolites) conduisant à des hypothèses physiopathologiques plausibles en accord avec les publications existantes. Pour conclure, dans cette thèse nous avons démontré que nos modèles locaux sont compétitifs en termes de pouvoir prédictifs et d'interprétation par rapport à d'autres méthodes plus classiques et cela sur différents jeux de données. |