Resumé |
En recherche médicale, les patients sont souvent confrontés à de multiples occurrences du même événement au fil du temps, comme des hospitalisations répétées ou des rechutes de cancer. L'analyse de survie classique modélise le temps jusqu'au premier événement et ne tient pas compte des occurrences subséquentes. Face à ce défi, des modèles statistiques ont été élaborés, mais sans consensus pour les données de grande dimension (lorsque le nombre de facteurs étudiés est supérieur à celui d'individus). Une revue de la littérature a révélé le manque de méthodes d'apprentissage adaptées pour traiter ce type de données. En réponse, ce projet de thèse introduit RecForest, une amélioration des forêts aléatoires de survie, en tirant parti des principes de l'analyse de survie pour événements récurrents et de l'apprentissage de méthodes dites d'ensemble. Des métriques de performance, telles que l'indice de concordance et l'erreur quadratique moyenne, ont été adaptées pour évaluer divers modèles de survie avec événements récurrents. De plus, cette thèse aborde le besoin croissant d'interprétabilité et d'explicabilité des algorithmes, en particulier lorsque ceux-ci se trouvent intégrés dans des dispositifs médicaux. Ce travail fournit les recommandations et bonnes pratiques pour assurer la conformité avec les normes des autorités de santé, soulignant la nécessité de dispositifs médicaux embarquant de l'IA transparents et responsables. Ces directives visent à améliorer l'évaluation de la performance algorithmique, favorisant la confiance et la fiabilité dans les outils d'aide à la décision médicale. |