Estimation adaptative avec des données transformées ou incomplètes. Application à des modèles de survie
Adaptive estimation with warped or incomplete data. Application to survival analysis
par Gaëlle CHAGNY sous la direction de Fabienne COMTE
Thèse de doctorat en Mathématiques
ED 386 Sciences Mathematiques de Paris Centre

Soutenue le vendredi 05 juillet 2013 à Université Paris Descartes ( Paris 5 )

Sujets
  • Estimation, Théorie de l'

Les thèses de doctorat soutenues à Université Paris Cité sont déposées au format électronique

Consultation de la thèse sur d’autres sites :

TEL (Version intégrale de la thèse (pdf))
Theses.fr (Version intégrale de la thèse (pdf))

Description en anglais
Description en français
Mots clés
Estimation adaptative,Sélection de modèles,Méthode de Lepski,Bases et noyaux déformés,Régression,Données censurées,Probème à deux échantilllons
Resumé
Cette thèse présente divers problèmes d'estimation fonctionnelle adaptative par sélection d'estimateurs en projection ou à noyaux, utilisant des critères inspirés à la fois de la sélection de modèles et des méthodes de Lepski. Le point commun de nos travaux est l'utilisation de données transformées et/ou incomplètes. La première partie est consacrée à une procédure d'estimation par "déformation'', dont la pertinence est illustrée pour l'estimation des fonctions suivantes : régression additive et multiplicative, densité conditionnelle, fonction de répartition dans un modèle de censure par intervalle, risque instantané pour des données censurées à droite. Le but est de reconstruire une fonction à partir d'un échantillon de couples aléatoires (X,Y). Nous utilisons les données déformées (¿(X),Y) pour proposer des estimateurs adaptatifs, où ¿ est une fonction bijective que nous estimons également (par exemple la fonction de répartition de X). L'intérêt est double : d'un point de vue théorique, les estimateurs ont des propriétés d'optimalité au sens de l'oracle ; d'un point de vue pratique, ils sont explicites et numériquement stables. La seconde partie s'intéresse à un problème à deux échantillons : nous comparons les distributions de deux variables X et X¿ au travers de la densité relative, définie comme la densité de la variable F¿(X) (F¿ étant la répartition de X¿). Nous construisons des estimateurs adaptatifs, à partir d'un double échantillon de données, possiblement censurées. Des bornes de risque non-asymptotiques sont démontrées, et des vitesses de convergences déduites.