Causalité ou corrélation ?

L’article publié par Le Monde sur la différence entre corrélation et causalité nous a inspirés. L’amalgame est facile, les raccourcis fréquents, et le tout peut facilement être transposé au revenue management.

L’article publié par Le Monde sur la différence entre corrélation et causalité nous a inspirés. L’amalgame est facile, les raccourcis fréquents, et le tout peut facilement être transposé au revenue management.

L’art de faire des conclusions hâtives

Un très bon article a été publié par le journal Le Monde sur la différence entre corrélation et causalité (disponible ici).

Le générateur aléatoire accessible dans l’article permet de comparer deux courbes très similaires entre elles, dont les destins semblent liés. Les coefficients de corrélation sont élevés, la représentation graphique est bluffante.

On a ainsi une corrélation évidente entre l’indice des prix des semences de maïs en France et les nouveau-nés français prénommés Lucien, ou encore entre les touristes au Népal et les taxes collectées sur les paris hippiques. Mais la corrélation n’est pas la causalité, et bien-sûr aucun des deux phénomènes observés n’explique l’autre.

Ces conclusions abusives sont parfois encouragées par deux effets :

  1. Les différences d’échelles et d’unités qui permettent de superposer des courbes, pour peu qu’on les tordent un peu. C’est souvent le cas lorsqu’on a une idée préconçue que l’on veut absolument étayer.
  2. Des similarités de contexte qui font prendre des raccourcis. C’est souvent révélateur d’un 3ème phénomène caché qui explique – au moins en partie – la corrélation observée. Par exemple une corrélation forte entre les achats de tenues de sport et les entorses au pied.

Quand le premier augmente, le deuxième aussi.

On peut conclure hâtivement qu’acheter un short provoque des entorses, mais on peut plus prudemment conclure qu’une troisième donnée en est à l’origine : l’évolution de la pratique du jogging (si celui-ci augmente, les deux autres aussi).

Et en revenue management ?

Dans notre métier, le Revenue Management, où le processus de prévision est clé, certains acteurs sont tentés d’exploiter la masse de données devenue disponible pour y faire des corrélations dans tous les sens. Et quand on cherche, on trouve.

On enjambe un peu vite tous les processus de vérification, de rigueur dans l’analyse, de sens métier à donner à ces variables, et on pose le pied rapidement sur le champ miné de certitudes.

Autre exemple. La bonne météo et le nombre de réservations sont corrélés dans les campings. Il y a plus de clients en août qu’en septembre car la météo y est plus favorable.

Conclusion possible : s’il fait beau, montons les prix, s’il pleut, baissons-les. Mais les clients réservent-ils en masse sur août parce qu’il fait beau ou simplement parce que c’est la période des vacances scolaires et que le camping se pratique largement en famille ?
Pour s’en convaincre, superposons d’un côté toutes les courbes de réservation d’août des 2 dernières années, peu importe la météo. Et d’un autre côté, superposons toutes les courbes avec beau temps, quelle que soit la date. Vous verrez bien si c’est la météo qui l’emporte ou la saisonnalité propre au mois d’août.

Soyons vigilants, et mettons du sens métier à nos analyses.

PASCAL NIFFOI

CELA POURRAIT VOUS INTÉRESSER…