Tuesday, April 10, 2012

Using Complex Surveys to Estimate the L1-Median of a Functional Variable: Application to Electricity Load Curves

Résumé 

Les courbes de profil moyen sont largement utilisées comme indicateurs du comportement de consommation d’électricité des clients. ÀÉlectricité de France (EDF), les profils de consommation de chaque catégorie de clients sont estimés par des courbes de charge moyennes. Malheureusement, la moyenne est très sensible à la présence des valeurs atypiques. Dans ce travail, nous proposons une alternative à la courbe moyenne: la L1-médiane, qui est plus robuste. En présence de grandes bases de données de type courbes (les courbes de charge, par exemple), des approches par sondages sont une alternative intéressante pour estimer la courbe médiane en évitant le stockage de courbes. Nous proposons ici plusieurs stratégies d’échantillonnage et plusieurs estimateurs de la courbe médiane. Une comparaison entre les différentes stratégies est réalisée sur une population-test. Nous développons une stratification basée sur les variables linéarisées qui améliore de façon substantielle l’estimateur par rapport au sondage aléatoire simple sans remise. Nous suggérons également un estimateur qui prend en compte l’information auxiliaire. Plusieurs directions de recherche sont envisagées.

Summary

Mean profiles are widely used as indicators of the electricity consumption habits of customers. Currently, in Électricité De France (EDF), class load profiles are estimated using point-wise mean profiles. Unfortunately, it is well known that the mean is highly sensitive to the presence of outliers, such as one or more consumers with unusually high-levels of consumption. In this paper, we propose an alternative to the mean profile: theL1-median profile which is more robust. When dealing with large data sets of functional data (load curves for example), survey sampling approaches are useful for estimating the median profile avoiding storing the whole data. We propose here several sampling strategies and estimators to estimate the median trajectory. A comparison between them is illustrated by means of a test population. We develop a stratification based on the linearized variable which substantially improves the accuracy of the estimator compared to simple random sampling without replacement. We suggest also an improved estimator that takes into account auxiliary information. Some potential areas for future research are also highlighted.

No comments:

Post a Comment

scientificpapers