Partitionnement statistique et optimisation : intéractions
1 : Laboratoire de Mathématiques dÓrsay
Université Paris-Saclay, Centre National de la Recherche Scientifique : UMR8628
On va évoquer le problème du partitionnement ("clustering") à partir d'un modèle statistique : peut-on discerner des groupes de variables (par exemple des familles de gènes ou régions du cerveau) de façon optimale, non-asymptotique, en grande dimension ?
En étudiant l'estimateur classique des k-moyennes, on donne des éléments de réponse en faisant le lien avec des problèmes d'optimisation convexe et non-convexe, mais aussi avec d'autres estimateurs connus comme les estimateurs spectraux.
[Peng, J. and Wei, Y., 2007]
[F. Bunea, C. Giraud, M. R. and N. Verzelen, 2016]