Agréger les prévisions pour préparer l’avenir

Gilles Stoltz, Professeur chercheur CNRS - 25 août 2016
Agréger les prévisions pour préparer l’avenir par Gilles Stoltz ©Fotolia-faithie

Le travail continu de recherche sur l’apprentissage automatique (« machine learning ») que nous menons à HEC Paris aide les managers à définir une vision plus précise de ce que sera l’avenir. En programmant un ordinateur pour agréger des lots de méthodes de prévision différentes et nombreuses, les managers sont libérés d’un choix difficile. 

Gilles Stoltz ©HEC Paris

Gilles Stoltz est chercheur CNRS dans le laboratoire GREGHEC. En tant que professeur à HEC Paris, il enseigne également la statistique dans le programme Grande Ecole. Ancien (...)

Voir le CV

Prévisions météorologiques, fluctuation possible des taux de change, évolution des préférences des consommateurs…, le succès d’une entreprise doit beaucoup à la précision des prévisions dont elle dispose. Dans de nombreux secteurs, les entreprises qui en ont les moyens recrutent des spécialistes du traitement des données chargés de l’élaboration des prévisions en interne, tandis que d’autres achètent leurs prévisions auprès d’un prestataire. 

Les décideurs aimeraient bien souvent que les experts sollicités leur apportent une prévision unique et précise, mais en réalité, même un unique expert pourra envisager différentes méthodes de prévision, dont chacune nécessitera généralement un travail de paramétrage et certains choix techniques. Et c’est encore pire quand plusieurs experts sont consultés ! Les entreprises ont donc l’embarras du choix quand vient le moment de sélectionner une méthode. Parmi ces méthodes, on retrouve les modèles statistiques classiques, qui modélisent les données passées pour élaborer des prévisions. Mais il existe également des approches dites d’apprentissage automatique : un ordinateur utilise un algorithme pour détecter automatiquement les données intéressantes et utiles, sans qu’on ait besoin de le guider. On distingue ces techniques d’apprentissage automatique selon la méthodologie utilisée (par exemple les forêts aléatoires, « random forests », qui utilisent des arbres de décision, ou l’apprentissage profond, « deep learning », qui fait appel à des transformations multicouches des données). Les managers sont confrontés à un large éventail de prévisions possibles et à ce qu’ils perçoivent comme un embarras du choix : ils considèrent cette situation comme un problème, alors que c’est une chance.

En effet, une solution existe. Tout comme dans la vie en dehors de l’entreprise, la diversité peut constituer une richesse. Ainsi, plutôt que de sélectionner à tout prix un expert ou une méthode de prévision, on peut combiner l’éventail de prévisions en une méta-prévision unique. Ce travail (qui est en soi une forme d’apprentissage automatique) peut être exécuté par des ordinateurs de façon à la fois automatisée et sûre. A HEC Paris, nous avons mis au point des outils d’agrégation des prévisions, qui aident les entreprises dans leurs prises de décisions. À ce jour, nous avons appliqué ces outils dans différents secteurs industriels : pour prévoir les taux de change à un rythme mensuel et dans une perspective macro-économique [1] ; pour prévoir la consommation d’électricité [2] en partenariat avec EDF,  premier fournisseur d’électricité en France ; pour prévoir la production de pétrole (travail en cours), et même pour prévoir la qualité de l’air [3]. 

Comment cela fonctionne-t-il ? En premier lieu, il faut concevoir intégralement le traitement automatisé des prévisions d’expert. Pour ce faire, nous créons des formules et des algorithmes, qui typiquement affectent un certain poids à chaque expert (ou méthode de prévision fondamentale) et font varier ces poids au cours du temps, en fonction des performances passées de chaque expert. Une fois programmée, une machine utilise ces algorithmes pour exécuter automatiquement l’agrégation souhaitée comme une boîte noire, sans nécessiter de supervision humaine. 

Cette façon d’agréger les prévisions des experts est efficace en pratique (dans des problèmes concrets, sur des données réelles) et apporte ce que nous appelons une « garantie théorique d’efficacité », raison pour laquelle elle est si sûre. À HEC comme dans d’autres centres de recherche dans le monde, nous avons mis au point des techniques d’agrégation aussi efficaces que le meilleur des experts, et même que la meilleure combinaison convexe (ou linéaire) constante des experts. Pour que cette meilleure combinaison constante soit efficace et précise, il faut qu’elle repose sur des prévisions collectées auprès d’un très grand nombre d’experts, très différents les uns des autres. Nous voyons cela comme un avantage et une sécurité car cela augmente la probabilité qu’au moins un d’entre eux soit bon. 

Bien entendu, l’agrégation de prévisions a ses limites. Premièrement, élaborer ou collecter des prévisions d’experts qui offrent une véritable diversité n’est pas toujours chose facile, car les experts sont souvent interchangeables en ce sens qu’ils prédisent des tendances similaires. Deuxièmement, cette agrégation en boîte noire de prévisions d’experts issues de différentes sources (experts humains, modèles statistiques, apprentissage automatisé) ne tente en rien de modéliser le phénomène sous-jacent, ce qui est en opposition marquée avec les approches statistiques ou économétriques plus classiques. Avec l’agrégation, tous les efforts sont concentrés sur l’efficacité des prévisions, rien n’est investi en modélisation. Il reste que ce fonctionnement peut s’avérer satisfaisant si le décideur final souhaite uniquement prendre de bonnes décisions, sans chercher à modéliser (comprendre) son environnement ! 

Dans le cadre de la poursuite du développement de cette solution d’agrégation à HEC, tant sur les plans théorique que pratique, nous avons commencé à travailler avec la start-up Datapred. Cette société de technologie, qui élabore des moteurs algorithmiques de pointe, nous aide à envisager les problèmes des entreprises de plus près encore que ne le permettent les études de cas à HEC Paris, par exemple avec la prévision de séries temporelles financières ou liées à la chaîne d’approvisionnement. 

Peut-être notre travail aidera-t-il les décideurs à se sentir plus à l’aise et même heureux, plutôt que perplexes, lorsqu’ils se trouveront face à la grande diversité des possibilités en matière de prévision. 


[1] Christophe Amat, Tomasz Michalski et Gilles Stoltz, Fundamentals and exchange rate forecastability with machine learning methods, 2015.

[2] Marie Devaine, Pierre Gaillard, Yannig Goude et Gilles Stoltz, Forecasting electricity consumption by aggregating specialized experts; a review of the sequential aggregation of specialized experts, with an application to Slovakian and French country-wide one-day-ahead (half-)hourly predictions, Machine Learning , 90(2):231-260, 2013

[3] Vivien Mallet, Gilles Stoltz et Boris Mauricette, Ozone ensemble forecast with machine learning algorithms, Journal of Geophysical Research , 114, D05307, 2009