graphorama.net

AccueilDatavisualisation › Le quartet d’Anscombe

Le quartet d’Anscombe

Le quartet d’Anscombe démontre que l’utilisation de la visualisation est nécessaire dans l’analyse de données en complément de l’utilisation des statistiques.

Le quartet d’Anscombe est un ensemble de quatre séries de données créées par le statisticien anglais Francis Anscombe en 1973.

Série 1Série 2Série 3Série4
0 x,y x,y x,y x,y
1 10.0,8.4 10.0,9.14 10.0,7.46 8.0,6.58
2 8.0,6.95 8.0,8.14 8.0,6.77 8.0,5.76
3 13.0,7.58 13.0,8.74 13.0,12.74 8.0,7.71
4 9.0,8.81 9.0,8.77 9.0,7.11 8.0,8.84
5 11.0,8.33 11.0,9.26 11.0,7.81 8.0,8.47
6 14.0,9.96 14.0,8.10 14.0,8.84 8.0,7.04
7 6.0,7.24 6.0,6.13 6.0,6.0 8,8.0,5.25
8 4.0,4.26 4.0,3.10 4.0,5.39 19.0,12.50
9 12.0,10.84 12.0,9.13 12.0,8.15 8.0,5.56
10 7.0,4.82 7.0,7.26 7.0,6.42 8.0,7.91
11 5.0,5.68 5.0,4.74 5.0,5.73 8.0,6.89
moyenne 9.0,7.50 9.0,7.50 9.0,7.50 9.0,7.50
variance 10.0,3.75 10.0,3.75 10.0,3.75 10.0,3.75
coeff. corrélation 0.816 0.816 0.816 0.816
régression linéaire y=3+0.5x y=3+0.5x y=3+0.5x y=3+0.5x

Lorsqu’on réalise une analyse statistique sur ces quatre séries de données, on constate qu’elles ont les mêmes propriétés. La moyenne, la variance, le coefficient de corrélation et l’équation de la droite de régression linéaire sont à chaque fois identiques.

Ces quatre séries se ressemblent donc d’un point de vue statistique. Et pourtant, si on visualise ces quatre séries sous la forme graphique, on constate immédiatement leurs différences.

La représentation graphique du quartet d’Anscombe

La visualisation des séries permet de mettre en évidence les données aberrantes, ce qui apporte une information complémentaire aux propriétés statistiques .
La quartet d’Anscombe démontre ainsi toute l’importance de la représentation graphique dans l’analyse de données.

Partager cet article :
© GRAPHORAMA.net - 19/11/2017