Médaille
N°1 pour apprendre & réviser du collège au lycée.

Statistiques

Déjà plus de

1 million

d'inscrits !

Avant de commencer, regarde la vidéo

Introduction :

Les statistiques sont revues chaque année depuis la troisième, de manière toujours plus approfondie. Cette leçon est donc constituée de rappels (comme les définitions de la médiane ou de la moyenne) et de nouveaux éléments comme la variance et l'écart-type.

Nous commencerons par des rappels sur les représentations graphiques de séries statistiques puis nous parlerons de la médiane, des quartiles et des diagrammes en boîte et nous terminerons par la moyenne, la variance et l'écart-type.

Rappels sur les représentations graphiques

bannière definition

Définition

Nuage de points :

Un nuage de points est, dans un repère, l'ensemble des points ayant pour abscisse une valeur du caractère et comme ordonnée l'effectif correspondant.

Un nuage de points Un nuage de points

bannière definition

Définition

Diagramme en bâtons :

Un diagramme en bâtons indique sous forme de segments les effectifs ou les fréquences qui correspondent aux valeurs du caractère étudié.

Diagramme en bâtons Diagramme en bâtons

bannière definition

Définition

Histogramme :

Un histogramme indique sous forme de rectangles les effectifs ou les fréquences en fonction des différentes valeurs du caractère étudié.

Histogramme Histogramme

Il est souvent demandé de tracer la courbe des effectifs cumulés croissants (ou décroissants) ou encore la courbe des fréquences cumulées croissantes (ou décroissantes) car cela donne de nombreuses informations sur une série statistique.

Fréquences cumulées décroissantes Fréquences cumulées décroissantes

 Fréquences cumulées croissantes Fréquences cumulées croissantes

Autour de la médiane

Médiane

bannière definition

Définition

Médiane :

On considère une série statistique de NN données rangées dans l'ordre croissant. La médiane est le nombre qui partage cette série ordonnée en deux groupes de même effectif :

  • Si NN est impair : la médiane est la « donnée centrale » de la série, c'est-à-dire la valeur de rang N+12\dfrac{N+1}2.
  • Si NN est pair : la médiane est la moyenne des deux « données centrales » de la série, c'est-à-dire la demi-somme des termes de rangs N2\dfrac N2 et N2+1\dfrac{N}2+1.
bannière exemple

Exemple

On considère la série statistique suivante : 1 ; 3 ; 6 ; 8 ; 10 ; 15 ; 22 ; 23 ; 311\ ;\ 3\ ;\ 6\ ;\ 8\ ;\ 10\ ;\ 15\ ;\ 22\ ;\ 23\ ;\ 31

Cette série comporte 99 données.

N=9N=9 étant impair, la médiane est la valeur de rang 9+12=5\dfrac{9+1}2=5, c'est-à-dire la 5e5^\text{e} valeur. La médiane est donc Med=10Med=10.

bannière exemple

Exemple

On considère maintenant la série statistique suivante : 3 ; 5 ; 9 ; 12 ; 25 ; 263\ ;\ 5\ ;\ 9\ ;\ 12\ ;\ 25\ ;\ 26

Cette série comporte 66 données.

N=6N=6 étant pair, la médiane est la demi-somme des termes de rangs N2\dfrac N2 et N2+1\dfrac{N}2+1.

N2=62=3\dfrac N2=\dfrac 62=3 et N2+1=62+1=4\dfrac{N}2+1=\dfrac{6}2+1=4

On fait donc la moyenne entre la 3e3^\text{e} et la 4e4^\text{e} valeur : 9+122=212=10,5\dfrac{9+12}2=\dfrac{21}2=10,5.

La médiane est donc Med=10,5Med=10,5.

Quartiles

bannière definition

Définition

Quartiles :

Dans une série où les termes sont ordonnés dans le sens croissant :

  • Le premier quartile est la plus petite valeur telle qu'au moins 2525% des valeurs de la série sont inférieures ou égales à Q1Q_1.
  • ​Le troisième quartile est la plus petite valeur telle qu'au moins 7575% des valeurs de la série sont inférieures ou égales à Q3Q_3.

bannière definition

Définition

Écart interquartile :

​Le nombre Q3Q1Q3-Q1 est appelé écart interquartile.

bannière definition

Définition

Étendue :

L'étendue d'une série statistique est la différence entre sa plus grande et sa plus petite valeur.

  • MaxMinMax-Min
bannière exemple

Exemple

Voyons comment déterminer les quartiles d'une série statistique de 5050 valeurs :

  • N=5014N=12,5N=50\Leftrightarrow\dfrac14N=12,5

Le plus petit entier supérieur à 12,512,5 est 1313.

Donc Q1Q_1 est la 13e13^\text{e} valeur.

  • N=5034N=37,5N=50\Leftrightarrow\dfrac34N=37,5

Le plus petit entier supérieur à 37,537,5 est 3838.

Donc Q3Q_3 est la 38e38^\text{e} valeur.

Diagramme en boîte

Soit les nombres Q1, Med et Q3Q1,\ Med\text{ et }Q3 ainsi que les valeurs extrêmes de la série, notées Min et MaxMin\text{ et }Max ; ils donnent un résumé d'une série statistique et une représentation graphique par un diagramme en boîte.

bannière à retenir

À retenir

L'épaisseur des rectangles tracés n'a pas de signification

D'autres représentations similaires sont utilisées, par exemple celle qui fait apparaître les déciles :

Les déciles sont définis de manière identique aux quartiles.

bannière definition

Définition

Déciles :

  • Le premier décile D1D1 est le plus petit élément des valeurs de la série tel qu'au moins 1010% des données sont inférieures ou égales à D1D1.
  • Le neuvième décile D9D9 est le plus petit élément des valeurs de la série tel qu'au moins 9090% des données sont inférieures ou égales à D9D9.

Autour de la moyenne

Moyenne

bannière definition

Définition

Moyenne :

La moyenne d'une série statistique, dont les valeurs du caractère sont x1, x2, , xkx1,\ x2,\ …,\ xk et les effectifs correspondants n1, n2, , nkn1,\ n2,\ …,\ nk, est notée xˉ\bar x et vaut :

xˉ=1Ni=1k=nixi\begin{array}{lr} \bar x=\dfrac1N \displaystyle{\sum{i=1}^k}=nix_i \end{array}
NN est l'effectif total de la série

bannière astuce

Astuce

xˉ\bar x se lit xx barre ; pour la formule précédente, cela donne xx barre égal 11 sur NN fois la somme pour ii allant de 11 à kk des nixinixi.

bannière exemple

Exemple

Voici les notes données à un groupe de 15 élèves.

Notes 3 5 6 7 7,5 8 9
Effectifs 2 1 4 1 2 3 2

xˉ=115×(3×2+5×1++9×2)=6,6\bar x=\dfrac{1}{15}×(3×2+5×1+…+9×2)=6,6.

  • La moyenne des notes est de 6,66,6.

Variance et écart-type

bannière definition

Définition

Variance :

  • La variance d'une série statistique, dont les valeurs du caractère sont x1, x2, , xkx1,\ x2,\ …,\ xk, les effectifs correspondants n1, n2, , nkn1,\ n2,\ …,\ nk et la moyenne xˉ\bar x, est égale à :

V=1N[i=1kni(xixˉ)2]V=1N[i=1knixi2]xˉ2\begin{aligned} V&=\dfrac1N\Bigg[\displaystyle{\sum{i=1}^kni(xi-\bar x)^2}\Bigg] \ V&=\dfrac1N\Bigg[\displaystyle{\sum{i=1}^k{nixi}^2}\Bigg]-{\bar x}^2 \end{aligned}

bannière definition

Définition

Écart-type :

L'écart-type d'une série statistique, noté σσ, est égal à la racine carrée de la variance σ=Vσ=\sqrt V

bannière exemple

Exemple

En reprenant la série de notes précédente V=115×(32×2+52×1++92×2)6,623,3V=\dfrac1{15}×(3^2×2+5^2×1+…+9^2×2)-6,6^2≈3,3 et σ=V1,8σ=\sqrt V≈1,8.