Médaille
N°1 pour apprendre & réviser du collège au lycée.
Marianne

Conforme au programme
officiel 2018 - 2019

Les caractéristiques d’une série statistique

Déjà plus de

1 million

d'inscrits !

Introduction :

Les caractéristiques d’une série statistique permettent de « caractériser » cette série en mettant en évidence des informations dont la valeur donne une indication importante, pertinente, sur la série statistique étudiée.

Nous commencerons ce cours par un rappel du vocabulaire statistique. Nous verrons ensuite les outils d’organisation de données. Enfin, nous apprendrons à traiter les informations d’une série en calculant ses caractéristiques de position (moyenne et médiane) puis de dispersion (étendue) et en interprétant les résultats.

Vocabulaire

Prenons un exemple concret.

Dans le cadre d’une étude sur l’âge des joueurs d’une équipe de rugby, on a demandé son âge à chaque joueur. Voici la liste des réponses recueillies (âges en années) :

24 ;23 ;35 ;27 ;24 ;21 ;31 ;28 ;29 ;24 ;22 ;32 ;32 ;26 ;24 ;24 ;25 ;22 ;25 ;27 ;27 ;29 ;33\scriptsize 24\ ; 23\ ; 35\ ; 27\ ; 24\ ; 21\ ; 31\ ; 28\ ; 29\ ; 24\ ; 22\ ; 32\ ; 32\ ; 26\ ; 24\ ; 24\ ; 25\ ; 22\ ; 25\ ; 27\ ; 27\ ; 29\ ; 33

bannière rappel

Rappel

  • En statistiques, la liste de données ci-dessus est appelée série de données statistique.
  • Étudier une série statistique correspond à l’étude d’un caractère (type de mesure) dans une population (ensemble étudié).
  • Ici, la population désigne les joueurs d’une équipe de rugby et le caractère étudié est l’âge des joueurs.
  • Les valeurs sont toutes les valeurs que peut prendre ce caractère.
  • Ici, ce sont toutes les valeurs entières de 2121 à 3535 (soit 1515 valeurs).
  • Les données sont toutes les mesures que l’on a recueillies.
  • Ici, ce sont les âges des 2323 joueurs.
  • L’effectif d’une valeur est le nombre de fois que cette valeur apparait dans la liste.
  • Par exemple ici, l’effectif de la valeur 2424 est 55.
  • L’effectif total est le nombre de données recueillies (soit la somme des effectifs).
  • Ici, l’effectif total est de 2323.
  • La fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total. Elle peut être laissée sous forme de fraction, ou donnée sous forme décimale ou de pourcentage.
  • Par exemple ici, la fréquence de la valeur 2424 est 5230,217\dfrac{5}{23} \approx 0,217 ce qui signifie que 55 joueurs sur 2323, soit environ 21,7 %21,7\ \% des joueurs, sont âgés de 2424 ans.

Organisation de données statistiques

bannière rappel

Rappel

Les résultats d’une étude statistique sont souvent rassemblés dans un tableau où apparaissent les valeurs, les effectifs ainsi que les fréquences.

Dans le cas de notre étude, on obtient le tableau suivant :

Âge Effectif Fréquence sous forme de quotient Fréquence sous forme décimale Fréquence sous forme de pourcentage
2121 11 123\dfrac{1}{23} 0,0430,043 4,3 %4,3\ \%
2222 22 223\dfrac{2}{23} 0,0870,087 8,7 %8,7\ \%
2323 11 123\dfrac{1}{23} 0,0430,043 4,3 %4,3\ \%
2424 55 523\dfrac{5}{23} 0,2170,217 21,7 %21,7\ \%
2525 22 223\dfrac{2}{23} 0,0870,087 8,7 %8,7\ \%
2626 11 123\dfrac{1}{23} 0,0430,043 4,3 %4,3\ \%
2727 33 323\dfrac{3}{23} 0,1300,130 13,0 %13,0\ \%
2828 11 123\dfrac{1}{23} 0,0430,043 4,3 %4,3\ \%
2929 22 223\dfrac{2}{23} 0,0870,087 8,7 %8,7\ \%
3030 00 00 0,0000,000 0 %0\ \%
3131 11 123\dfrac{1}{23} 0,0430,043 4,3 %4,3\ \%
3232 22 223\dfrac{2}{23} 0,0870,087 8,7 %8,7\ \%
3333 11 123\dfrac{1}{23} 0,0430,043 4,3 %4,3\ \%
3434 00 00 0,0000,000 0 %0\ \%
3535 11 123\dfrac{1}{23} 0,0430,043 4,3 %4,3\ \%
Total 2323 2323\dfrac{23}{23} 0,99610,996\approx 1 99,6 %100 %99,6\ \% \approx 100\ \%

Un tableau statistique est parfois long et fastidieux à consulter et ne permet pas forcément de se faire une idée globale du résultat de l’étude.

Les caractéristiques d'une série permettent d'avoir une vue d'ensemble de cette série.

Caractéristiques de position d’une série statistique

Moyenne

bannière definition

Définition

Moyenne :

La moyenne d’une série statistique est le quotient de la somme de toutes les données de cette série par l’effectif total.

bannière astuce

Astuce

La moyenne indique la valeur que prendrait chacune des données si tous les membres de la population étaient identiques.

bannière exemple

Exemple

24 ;23 ;35 ;27 ;24 ;21 ;31 ;28 ;29 ;24 ;22 ;32 ;32 ;26 ;24 ;24 ;25 ;22 ;25 ;27 ;27 ;29 ;33\scriptsize 24\ ; 23\ ; 35\ ; 27\ ; 24\ ; 21\ ; 31\ ; 28\ ; 29\ ; 24\ ; 22\ ; 32\ ; 32\ ; 26\ ; 24\ ; 24\ ; 25\ ; 22\ ; 25\ ; 27\ ; 27\ ; 29\ ; 33

Dans notre exemple cela donne :

24+23+35+27+24+21+31+28+29+24+22+32+32+26+24+24+25+22+25+27+27+29+3323=6142327\tiny \begin{aligned}\frac{24+23+35+27+24+21+31+28+29+24+22+32+32+26+24+24+25+22+25+27+27+29+33}{23} &=\frac{614}{23}\ &\approx 27\end{aligned}

  • La moyenne d’âge des joueurs de cette équipe est d’environ 27 ans27\text{ ans}.

Pour calculer cette moyenne, on s’est intéressé aux données recueillies dont on a fait la somme, somme que l’on a ensuite divisée par l’effectif total.

On aurait aussi pu utiliser le tableau que nous avons établi et considérer les valeurs pondérées par leur effectif respectif.

bannière exemple

Exemple

24 ;23 ;35 ;27 ;24 ;21 ;31 ;28 ;29 ;24 ;22 ;32 ;32 ;26 ;24 ;24 ;25 ;22 ;25 ;27 ;27 ;29 ;33\scriptsize 24\ ; 23\ ; 35\ ; 27\ ; 24\ ; 21\ ; 31\ ; 28\ ; 29\ ; 24\ ; 22\ ; 32\ ; 32\ ; 26\ ; 24\ ; 24\ ; 25\ ; 22\ ; 25\ ; 27\ ; 27\ ; 29\ ; 33

Cela aurait donné :

21+22×2+23+24×5+25×2+26+27×3+28+29×2+31+32×2+33+3523\scriptsize \dfrac{21+22\times 2+23+24\times 5+25 \times 2+26+27\times 3+28+29\times 2+31+32\times 2+33+35}{23}

On respecte les priorités opératoires : 21+44+23+120+50+26+81+28+58+31+64+33+3523=6142327\scriptsize \begin{aligned}\dfrac{21+44+23+120+50+26+81+28+58+31+64+33+35}{23}&=\dfrac{614}{23}\ &\approx 27\end{aligned}

Bien évidemment, on obtient la même valeur de moyenne, appelée ici moyenne pondérée.

Médiane

bannière definition

Définition

Médiane :

Les données d’une série statistique étant rangées dans l’ordre croissant, on appelle médiane de cette série un nombre qui partage la série en deux groupes de même effectif.

bannière à retenir

À retenir

  • Il y a autant de données avant la médiane qu’après la médiane.
  • Lorsque l’effectif total est impair, la médiane est la valeur centrale de la série.
  • Lorsque l’effectif total est pair, la médiane est n’importe quel nombre compris entre les deux valeurs centrales. On prend généralement la moyenne des deux.
bannière exemple

Exemple

  • Cas d’un nombre impair de données

Reprenons notre exemple et classons d’abord nos données dans l’ordre croissant.
On obtient : 21 ;22 ;22 ;23 ;24 ;24 ;24 ;24 ;24 ;25 ;25 ;26 ;27 ;27 ;27 ;28 ;29 ;29 ;31 ;32 ;32 ;33 ;35\scriptsize 21\ ; 22\ ; 22\ ; 23\ ; 24\ ; 24\ ; 24\ ; 24\ ; 24\ ; 25\ ; 25\ ; 26\ ; 27\ ; 27\ ; 27\ ; 28\ ; 29\ ; 29\ ; 31\ ; 32\ ; 32\ ; 33\ ; 35

On dispose d’un effectif total de 2323 données.

On peut donc partager cette série en deux groupes de 1111 données, et la valeur centrale sera la 12e12^{\text{e}} donnée.

médiane caractéristiques d’une série statistique mathématiques troisième

  • La médiane de cette série est 2626.

On peut donc dire qu’au moins 50 %50\ \% des joueurs ont un âge inférieur ou égal à 2626 ans.

bannière attention

Attention

En général, la médiane est différente de la moyenne.

Ici, la moyenne d’âge des joueurs (2727 ans) est supérieure à la médiane (2626 ans). Cela s’explique par le fait que les joueurs les plus âgés sont beaucoup plus âgés. Ils « tirent » la moyenne vers le haut.

  • Cas d’un nombre pair de données

Prenons un autre exemple.

On demande à un élève de faire germer 1010 lentilles et de mesurer la taille des germes au bout d’une semaine de germination. On lui demande également de calculer la moyenne et la médiane des résultats obtenus.

Voici les mesures effectuées par l’élève au bout de 77 jours (en centimètres) :

13 ;4 ;7 ;15 ;14 ;10 ;5 ;7 ;13 ;1413\ ; 4\ ; 7\ ;15\ ; 14\ ; 10\ ; 5\ ; 7\ ; 13\ ; 14

Pour obtenir la taille moyenne, on fait la somme des données et on divise par l’effectif total :

13+4+7+15+14+10+5+7+13+1410=10210=10,2\dfrac{13+4+7+15+14+10+5+7+13+14}{10}=\dfrac{102}{10}=10,2

  • La taille moyenne des germes est 10,2 cm10,2\text{ cm}.

Pour calculer la médiane, on classe d’abord less données dans l’ordre croissant : 4 ;5 ;7 ;7 ;10 ;13 ;13 ;14 ;14 ;154\ ; 5\ ; 7\ ; 7\ ; 10\ ; 13\ ; 13\ ; 14\ ; 14\ ; 15

On dispose ici d’un effectif total de 1010 données.
On peut donc partager cette série en deux groupes de 55 données, les 22 valeurs centrales étant la 5e5^{\text{e}} et la 6e6^{\text{e}} données.

médiane caractéristiques d’une série statistique mathématiques troisième

La médiane est donc comprise entre les valeurs 1010 et 1313.
On choisit de prendre la moyenne des deux soit : 10+132=11,5\dfrac{10+13}{2}=11,5

  • La médiane de cette série est 11,511,5.

On peut donc dire qu’au moins 50 %50\ \% des germes ont une taille inférieure ou égale à 11,5 cm11,5\text{ cm}. Ou, mieux encore dans ce cas, au moins 50 %50\ \% des germes ont une taille supérieure ou égale à 11,5 cm11,5\text{ cm}.

Cette médiane est plus élevée que la moyenne car les plus petits germes sont vraiment petits. Ils « tirent » la moyenne vers le bas.

Caractéristique de dispersion d’une série statistique : l’étendue

bannière definition

Définition

Étendue :

L’étendue d’une série statistique est la différence entre la plus grande valeur et la plus petite valeur de cette série :

Eˊtendue=Valeur maxValeur min\text{Étendue} = \text{Valeur max} - \text{Valeur min}

bannière à retenir

À retenir

L’étendue d’une série statistique mesure la dispersion.

  • Plus l’étendue est grande, plus la série est dispersée et hétérogène.
  • Plus l’étendue est petite, plus la série est homogène.
bannière exemple

Exemple

Reprenons l’exemple de l’équipe de rugby.

24 ;23 ;35 ;27 ;24 ;21 ;31 ;28 ;29 ;24 ;22 ;32 ;32 ;26 ;24 ;24 ;25 ;22 ;25 ;27 ;27 ;29 ;33\scriptsize 24\ ; 23\ ; 35\ ; 27\ ; 24\ ; 21\ ; 31\ ; 28\ ; 29\ ; 24\ ; 22\ ; 32\ ; 32\ ; 26\ ; 24\ ; 24\ ; 25\ ; 22\ ; 25\ ; 27\ ; 27\ ; 29\ ; 33

La plus petite valeur est 2121.
La plus grande est 3535.

  • L’étendue de cette série est égale à 352135 - 21 soit 1414 ans.

On peut donc dire que, dans cette équipe de rugby, il y a 1414 ans d’écart entre le joueur le plus jeune et le joueur le plus âgé.