4. Statistiques
I) Caractéristiques de position d’une série statistique (Rappels)
1) Série statistique
Voici les séries de notes obtenues par 3 élèves :
Jérôme : 4 ; 6 ; 18 ; 7 ; 17 ; 12 ; 12 ; 18
Bertrand : 13 ; 13 ; 12 ; 10 ; 12 ; 3 ; 14 ; 12 ; 14 ; 15
Julie : 15 ; 9 ; 14 ; 13 ; 10 ; 12 ; 12 ; 11 ; 10
2) Moyenne
Méthode : Calculer une moyenne
Calculer la moyenne pour chaque série de notes de Jérôme, de Bertrand et de Julie.
M(Jérôme) = (4 + 6 + 18 + 7 + 17 + 12 + 12 + 18) : 8 ≈ 11,8
M(Bertrand) = (13 + 13 + 12 + 10 + 12 + 3 + 14 + 12 + 14 + 15) : 10 = 11,8
M(Julie) = (15 + 9 +14 + 13 + 10 + 12 + 12 + 11 + 10) : 9 ≈ 11,8
La moyenne est une caractéristique de position.
- Médiane
Méthode : Calculer une médiane
Calculer la médiane pour chaque série de notes de Jérôme, de Bertrand et de Julie.
Pour déterminer les notes médianes, il faut ordonner les séries. La médiane partage l’effectif en deux.

Définition :
La médiane m est une valeur telle que la moitié au moins de l’effectif ait des valeurs inférieures ou égales à m, l’autre moitié des valeurs supérieures ou égales à m.
La médiane est une caractéristique de position.
II) Caractéristiques de dispersion d’une série statistique
1) Étendue (Rappel)
Définition : L’étendue d’une série statistique est la différence entre la plus grande valeur et la plus petite valeur de la série.
Méthode : Calculer une étendue
Calculer l’étendue pour chaque série de notes de Jérôme, de Bertrand et de Julie.
E(Jérôme) = 18 – 4 =14
E(Julie) = 15 – 9 = 6
E(Bertrand) = 15 – 10 = 5
On considère que 10 est la plus petite valeur car « 3 » est négligeable dans la série de Bertrand. On dit qu’on a élagué la série.
L’étendue est une caractéristique de dispersion.
2) Quartiles, écart interquartile
Définitions :
Le premier quartile est la plus petite valeur de la série telle qu’au moins 25 % des autres valeurs de la série sont inférieures ou égales à cette valeur.
Le troisième quartile est la plus petite valeur de la série telle qu’au moins 75 % des autres valeurs de la série sont inférieures ou égales à cette valeur.
Définition : L’écart interquartile d’une série statistique de premier quartile Q1 et de troisième quartile Q3 est égal à la différence Q3 – Q1.
Remarque :
L’écart interquartile d’une série mesure la dispersion autour de la médiane. Il contient au moins 50% des valeurs de la série.
L’écart interquartile n’est pas influencé par les valeurs extrêmes de la série.
Méthode : Calculer les quartiles
Calculer les quartiles pour chaque série de notes de Jérôme, de Bertrand et de Julie.
Pour déterminer les quartiles, il faut ordonner les séries.
Le premier quartile est la donnée de la série se trouvant au quart de l’effectif.
Le troisième quartile est la donnée de la série se trouvant au trois-quarts de l’effectif.

L’écart interquartile est égal à EQ(Jérôme) = Q3(Jérôme) – Q1(Jérôme) = 17 – 6 = 11

L’écart interquartile est égal à EQ(Bertrand) = Q3(Bertrand) – Q1(Bertrand) = 14 – 12 = 2

L’écart interquartile est égal à EQ(Julie) = Q3(Julie) – Q1(Julie) = 13 – 10 = 3
Les quartiles sont des caractéristiques de dispersion.
3) Interprétations



Les moyennes sont environ égales et pourtant les notes ne se répartissent pas de la même manière autour de cette caractéristique de position. Les étendues sont très différentes.
Dire que Jérôme à une médiane égale à 12 signifie que Jérôme a obtenu autant de notes au-dessus de 12 que de notes en-dessous de 12.
Dire que le premier quartile de Bertrand est égal à 12 signifie qu’au moins un quart des notes de Bertrand sont inférieures à 12.
Dire que le troisième quartile de Julie est égal à 13 signifie qu’au moins trois quarts des notes de Julie sont inférieurs à 13.
L’écart interquartile de Jérôme est égal à 11 signifie qu’au moins 50% des notes de Jérôme sont comprises entre 6 et 17 (les quartiles).
III) Cas de pondération d’une série statistique
1) Série statistique
Tailles des élèves de 2nde5 en cm :
174 – 160 – 161 – 166 – 177 – 172 – 157 – 175 – 162 – 169 – 160 – 165 – 170 – 152 – 168 – 156 – 163 – 167 – 169 – 158 – 164 – 151 – 162 – 166 – 156 – 165 – 179
2) Regroupement par classe
Regrouper cette série de tailles par classes de longueur 5 cm et calculer les fréquences arrondies au centième :

L’effectif total est 27.

Remarque :
Dans un histogramme, l’aire des rectangles est proportionnelle à l’effectif (ou à la fréquence).
Ainsi, dans l’exemple, en regroupant les deux premières classes, on obtiendrait la représentation suivante :

3) Moyenne pondérée

Il s’agit d’un calcul de moyenne pondéré car des effectifs différents ni sont associés à chaque valeur xi.
Définition :
La moyenne d’une série statistique dont les valeurs sont x1, x2 , …, xk et les effectifs correspondants n1, n2, …, nk est notée \bar{x} = \frac{n_1 x_1 +...+n_k x_k}{n_1 + ... +n_k}.
Ainsi dans l’exemple :
\bar{x} = (2 x 152 + 4 x 157 + 7 x 162 + 8 x 167 + 3 x 172 + 3 x 177) : 27 = 4449 : 27 ≈ 164,8 cm
Remarque : Calcul de la moyenne exacte
(174 + 160 + 161 + 166 + 177 + 172 + 157+ 175 + 162 + 169 + 160 + 165 + 170 + 152 + 168 + 156 + 163 + 167+ 169 + 158 + 164 + 151 + 162 + 166+ 156 + 165 + 179) : 27
= 4444 : 27 ≈ 164,6 cm
La méthode de calcul de moyenne en centrant les classes est très fiable (ici : 2 mm d’erreur)
4) Linéarité de la moyenne
Si une série de valeurs x_i a pour moyenne \bar{x} , alors la série de valeurs ax_i + b, avec a et b réels, a pour moyenne a\bar{x} + b.
Exemple :

On a \bar{x} = 3, et donc en appliquant la propriété, la moyenne de la série 2x_i - 5 est égale à : 2\bar{x} - 5 = 2 x 3 - 5 = 1. On retrouve bien le résultat calculé directement dans le tableau.