9 : Statistiques – Tle L

  1. GENERALITES :

1.-Vocabulaires :

a.- Population – Variable

Effectuer une étude statistique consiste à collecter, organiser et exploiter des informations sur un ensemble appelé population, délimité par une propriété commune. Cette population est constituée d’individus ou unités statistiques, qui peuvent être des objets, des idées, des êtres vivants… La propriété étudiée est appelée variable ou caractère.

Le caractère est qualitatif lorsque les valeurs prises ne sont pas des nombres, et quantitatif, lorsque les valeurs prises sont des nombres.

Un caractère quantitatif peut être discret si les valeurs prises sont isolées, ou continu s’il peut prendre toutes les valeurs possibles d’un intervalle.

b.- Effectifs – Fréquence- Classes

L’effectif total est le nombre d’individus de la population.

On note en général x1, x2, …, xn les valeurs prises par la variable étudiée et ni le nombre d’individus sur lesquels on a observé la valeur xi. ni est appelé effectif de la valeur xide la variable.

La série statistique ainsi définie se note (xi , ni).

Lorsque le caractère est continu, on ne peut pas considérer chaque valeur séparément, on regroupe alors ces valeurs par classe.

De même lorsque l’effectif est assez important, il est plus commode de regrouper les valeurs par classe.

Exemple :

La population étudiée est l’ensemble des élèves d’une classe. Le caractère étudié est la note obtenue lors d’un certain examen. Les notes obtenues sont :

         12  12  14   5   8   8  9  16  15  7   6   10   10  12   9   9   10   7   6  10      11  9  7  9   11

      Ecrivons cette série de notes dans l’ordre croissant :

     5   6  6  7  7  7  8  8  9  9  9  9  9  10  10  10  10  11  11  12  12  12  14 15  16

On voit que 1 élève a eu 5, deux ont eu 6, …. On peut réécrire cette série sous forme de tableau :

Effectifs cumulés – Fréquences cumulées

Considérons une série à caractère quantitatif xi. On ordonne les valeurs dans l’ordre croissant : x1 < x2 <…< xk.

Si ni est l’effectif de la valeur xi, on appelle effectif cumulé croissant jusqu’à la ie  valeur le nombre des individus présentant une modalité inférieure à xi .

Ce tableau nous donne le nombre d’élèves qui ont eu une note inférieure à une note donnée. Par exemple, 6 élèves ont eu une note inférieure ou égale à 7, 13 n’ont pas eu la moyenne…

On définit de même

2.- Diagrammes

Un diagramme est une représentation graphique de la série. Il permet de visualiser l’ensemble les données statistiques.

a) Diagramme à bandes. Diagramme à bâtons

On porte en abscisses les valeurs de la variable x et en ordonnées les effectifs. Les effectifs sont représentés par des rectangles (bandes) verticales de longueurs proportionnelles aux effectifs. On peut remplacer les bandes par des segments : on obtient un diagramme en bâtons.

b) Diagramme à secteur

     C’est un disque partagé en secteurs dont les angles sont proportionnels aux effectifs

Diagramme à secteur

c) Histogrammes: Cas d’une série continue ou série classée.

On porte en abscisses les valeurs de la variable x et en ordonnées les effectifs. L’effectif est représenté par un rectangle dont la base est égale à l’étendue de la classe et la hauteur proportionnelle à l’effectif.

Exemple

Dans l’exemple précédent, regroupons les notes en classes d’amplitude 2

On obtient le tableau suivant :

Polygones des effectifs

  En reliant les extrémités des bâtons, on obtient le polygone des effectifs. Dans le cas des histogrammes, on prend les centres des classes. 

II. CARACTÉRISTIQUES D’UNE SÉRIE STATISTIQUE

Une caractéristique est une grandeur qu’on utilise pour résumer une série statistique.

On distingue deux sortes de caractéristique : caractéristique de position et caractéristiques de dispersion.

1.- Caractéristique de position

a) Le mode :

Le mode ( ou dominante) est la valeur la plus fréquente de la variable. C’est  la variable qui a le plus grand effectif.

Le mode est défini même si la variable est qualitative.

Pour une série classée, dont les classes sont d’égal effectif, la classe modale est la classe qui correspond au plus grand effectif.

Si une série peut posséder un seul mode on dit qu’elle est unimodale. Si elle en possède plusieurs, on dit qu’elle est plurimodale.

c) la médiane  :

  • Définition :

C’est la valeur de la variable qui partage la population en deux parties de même effectif: c’est donc la valeur M de xi telle que la moitié au plus des valeurs des xi soient  inférieures à M et la moitié au plus des valeurs de xi supérieure à M

  • Détermination de la médiane :
    • Cas d’une série discrète

On range dans l’ordre croissant les valeurs de la variable, chaque valeur étant écrite autant de fois qu’elle est prise :

  • Si le nombre de valeurs est impair, la médiane est la valeur du milieu
  • Si le nombre de valeurs est pair, on peut prendre comme médiane tout valeur comprise entre les deux valeurs au centre. Par convention, on prend la demi somme de ces deux valeurs :
  • Cas d’une série classée :

2. Caractéristique de dispersion.

Une caractéristique de dispersion est utilisée pour évaluer la dispersion d’une série. On utilise le plus souvent la variance et l’écart type .

Variance. Ecart type

  • Définition

La variance d’une série est la moyenne des carrés des écarts à la moyenne.

L’écart type d’une série est la moyenne quadratique des écarts à la moyenne. C’est la racine carrée de la variance :

  • Remarques.
    • Plus la variance est grande, plus la série est dispersée.
    • Plus la variance est petite (voisin de 0), pus la série est resserrée autour de la moyenne.
    • La variance  est une quantité positive ou nulle.
  • Méthode de calcul

Même avec des valeurs observées xi très simples, il arrive souvent que la moyenne  soit un nombre décimal. Dans ce cas, le calcul de la variance V nécessite des calculs fastidieux.