Les caractéristiques d'une série statistique

information-icon

Si tu es en classe de 3eme,tu dois savoir que tu passeras ton premier examen 😉. Consulte notre dossier spécial brevet des collèges pour tout savoir sur les dates du brevet 2024, les conseils de révisions… 💪

Introduction :

Les caractéristiques d’une série statistique permettent de « caractériser » cette série en mettant en évidence des informations dont la valeur donne une indication importante, pertinente, sur la série statistique étudiée.

Nous commencerons ce cours par un rappel du vocabulaire statistique. Nous verrons ensuite les outils d’organisation de données. Enfin, nous apprendrons à traiter les informations d’une série en calculant ses caractéristiques de position (moyenne et médiane) puis de dispersion (étendue) et en interprétant les résultats.

Vocabulaire

Prenons un exemple concret.

Dans le cadre d’une étude sur l’âge des joueurs d’une équipe de rugby, on a demandé son âge à chaque joueur. Voici la liste des réponses recueillies (âges en années) :

$$\scriptsize 24\ ; 23\ ; 35\ ; 27\ ; 24\ ; 21\ ; 31\ ; 28\ ; 29\ ; 24\ ; 22\ ; 32\ ; 32\ ; 26\ ; 24\ ; 24\ ; 25\ ; 22\ ; 25\ ; 27\ ; 27\ ; 29\ ; 33$$

bannière rappel

Rappel

  • En statistiques, la liste de données ci-dessus est appelée série de données statistique.
  • Étudier une série statistique correspond à l’étude d’un caractère (type de mesure) dans une population (ensemble étudié).
  • Ici, la population désigne les joueurs d’une équipe de rugby et le caractère étudié est l’âge des joueurs.
  • Les valeurs sont toutes les valeurs que peut prendre ce caractère.
  • Ici, ce sont toutes les valeurs entières de $21$ à $35$ (soit $15$ valeurs).
  • Les données sont toutes les mesures que l’on a recueillies.
  • Ici, ce sont les âges des $23$ joueurs.
  • L’effectif d’une valeur est le nombre de fois que cette valeur apparait dans la liste.
  • Par exemple ici, l’effectif de la valeur $24$ est $5$.
  • L’effectif total est le nombre de données recueillies (soit la somme des effectifs).
  • Ici, l’effectif total est de $23$.
  • La fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total. Elle peut être laissée sous forme de fraction, ou donnée sous forme décimale ou de pourcentage.
  • Par exemple ici, la fréquence de la valeur $24$ est $\dfrac{5}{23} \approx 0,217$ ce qui signifie que $5$ joueurs sur $23$, soit environ $21,7\ \%$ des joueurs, sont âgés de $24$ ans.

Organisation de données statistiques

bannière rappel

Rappel

Les résultats d’une étude statistique sont souvent rassemblés dans un tableau où apparaissent les valeurs, les effectifs ainsi que les fréquences.

Dans le cas de notre étude, on obtient le tableau suivant :

Âge Effectif Fréquence sous forme de quotient Fréquence sous forme décimale Fréquence sous forme de pourcentage
$21$ $1$ $\dfrac{1}{23}$ $0,043$ $4,3\ \%$
$22$ $2$ $\dfrac{2}{23}$ $0,087$ $8,7\ \%$
$23$ $1$ $\dfrac{1}{23}$ $0,043$ $4,3\ \%$
$24$ $5$ $\dfrac{5}{23}$ $0,217$ $21,7\ \%$
$25$ $2$ $\dfrac{2}{23}$ $0,087$ $8,7\ \%$
$26$ $1$ $\dfrac{1}{23}$ $0,043$ $4,3\ \%$
$27$ $3$ $\dfrac{3}{23}$ $0,130$ $13,0\ \%$
$28$ $1$ $\dfrac{1}{23}$ $0,043$ $4,3\ \%$
$29$ $2$ $\dfrac{2}{23}$ $0,087$ $8,7\ \%$
$30$ $0$ $0$ $0,000$ $0\ \%$
$31$ $1$ $\dfrac{1}{23}$ $0,043$ $4,3\ \%$
$32$ $2$ $\dfrac{2}{23}$ $0,087$ $8,7\ \%$
$33$ $1$ $\dfrac{1}{23}$ $0,043$ $4,3\ \%$
$34$ $0$ $0$ $0,000$ $0\ \%$
$35$ $1$ $\dfrac{1}{23}$ $0,043$ $4,3\ \%$
Total $23$ $\dfrac{23}{23}$ $0,996\approx 1$ $99,6\ \% \approx 100\ \%$

Un tableau statistique est parfois long et fastidieux à consulter et ne permet pas forcément de se faire une idée globale du résultat de l’étude.

Les caractéristiques d'une série permettent d'avoir une vue d'ensemble de cette série.

Caractéristiques de position d’une série statistique

Moyenne

bannière definition

Définition

Moyenne :

La moyenne d’une série statistique est le quotient de la somme de toutes les données de cette série par l’effectif total.

bannière astuce

Astuce

La moyenne indique la valeur que prendrait chacune des données si tous les membres de la population étaient identiques.

bannière exemple

Exemple

$$\scriptsize 24\ ; 23\ ; 35\ ; 27\ ; 24\ ; 21\ ; 31\ ; 28\ ; 29\ ; 24\ ; 22\ ; 32\ ; 32\ ; 26\ ; 24\ ; 24\ ; 25\ ; 22\ ; 25\ ; 27\ ; 27\ ; 29\ ; 33$$

Dans notre exemple cela donne :

$$\tiny \begin{aligned}\frac{24+23+35+27+24+21+31+28+29+24+22+32+32+26+24+24+25+22+25+27+27+29+33}{23} &=\frac{614}{23}\\ &\approx 27\end{aligned}$$

  • La moyenne d’âge des joueurs de cette équipe est d’environ $27\text{ ans}$.

Pour calculer cette moyenne, on s’est intéressé aux données recueillies dont on a fait la somme, somme que l’on a ensuite divisée par l’effectif total.

On aurait aussi pu utiliser le tableau que nous avons établi et considérer les valeurs pondérées par leur effectif respectif.

bannière exemple

Exemple

$$\scriptsize 24\ ; 23\ ; 35\ ; 27\ ; 24\ ; 21\ ; 31\ ; 28\ ; 29\ ; 24\ ; 22\ ; 32\ ; 32\ ; 26\ ; 24\ ; 24\ ; 25\ ; 22\ ; 25\ ; 27\ ; 27\ ; 29\ ; 33$$

Cela aurait donné :

$$\scriptsize \dfrac{21+22\times 2+23+24\times 5+25 \times 2+26+27\times 3+28+29\times 2+31+32\times 2+33+35}{23}$$

On respecte les priorités opératoires : $$\scriptsize \begin{aligned}\dfrac{21+44+23+120+50+26+81+28+58+31+64+33+35}{23}&=\dfrac{614}{23}\\ &\approx 27\end{aligned}$$

Bien évidemment, on obtient la même valeur de moyenne, appelée ici moyenne pondérée.

Médiane

bannière definition

Définition

Médiane :

Les données d’une série statistique étant rangées dans l’ordre croissant, on appelle médiane de cette série un nombre qui partage la série en deux groupes de même effectif.

bannière à retenir

À retenir

  • Il y a autant de données avant la médiane qu’après la médiane.
  • Lorsque l’effectif total est impair, la médiane est la valeur centrale de la série.
  • Lorsque l’effectif total est pair, la médiane est n’importe quel nombre compris entre les deux valeurs centrales. On prend généralement la moyenne des deux.
bannière exemple

Exemple

  • Cas d’un nombre impair de données

Reprenons notre exemple et classons d’abord nos données dans l’ordre croissant.
On obtient : $$\scriptsize 21\ ; 22\ ; 22\ ; 23\ ; 24\ ; 24\ ; 24\ ; 24\ ; 24\ ; 25\ ; 25\ ; 26\ ; 27\ ; 27\ ; 27\ ; 28\ ; 29\ ; 29\ ; 31\ ; 32\ ; 32\ ; 33\ ; 35$$

On dispose d’un effectif total de $23$ données.

On peut donc partager cette série en deux groupes de $11$ données, et la valeur centrale sera la $12^{\text{e}}$ donnée.

médiane caractéristiques d’une série statistique mathématiques troisième

  • La médiane de cette série est $26$.

On peut donc dire qu’au moins $50\ \%$ des joueurs ont un âge inférieur ou égal à $26$ ans.

bannière attention

Attention

En général, la médiane est différente de la moyenne.

Ici, la moyenne d’âge des joueurs ($27$ ans) est supérieure à la médiane ($26$ ans). Cela s’explique par le fait que les joueurs les plus âgés sont beaucoup plus âgés. Ils « tirent » la moyenne vers le haut.

  • Cas d’un nombre pair de données

Prenons un autre exemple.

On demande à un élève de faire germer $10$ lentilles et de mesurer la taille des germes au bout d’une semaine de germination. On lui demande également de calculer la moyenne et la médiane des résultats obtenus.

Voici les mesures effectuées par l’élève au bout de $7$ jours (en centimètres) :

$$13\ ; 4\ ; 7\ ;15\ ; 14\ ; 10\ ; 5\ ; 7\ ; 13\ ; 14$$

Pour obtenir la taille moyenne, on fait la somme des données et on divise par l’effectif total :

$$\dfrac{13+4+7+15+14+10+5+7+13+14}{10}=\dfrac{102}{10}=10,2$$

  • La taille moyenne des germes est $10,2\text{ cm}$.

Pour calculer la médiane, on classe d’abord les données dans l’ordre croissant : $$4\ ; 5\ ; 7\ ; 7\ ; 10\ ; 13\ ; 13\ ; 14\ ; 14\ ; 15$$

On dispose ici d’un effectif total de $10$ données.
On peut donc partager cette série en deux groupes de $5$ données, les $2$ valeurs centrales étant la $5^{\text{e}}$ et la $6^{\text{e}}$ données.

médiane caractéristiques d’une série statistique mathématiques troisième

La médiane est donc comprise entre les valeurs $10$ et $13$.
On choisit de prendre la moyenne des deux soit : $$\dfrac{10+13}{2}=11,5$$

  • La médiane de cette série est $11,5$.

On peut donc dire qu’au moins $50\ \%$ des germes ont une taille inférieure ou égale à $11,5\text{ cm}$. Ou, mieux encore dans ce cas, au moins $50\ \%$ des germes ont une taille supérieure ou égale à $11,5\text{ cm}$.

Cette médiane est plus élevée que la moyenne car les plus petits germes sont vraiment petits. Ils « tirent » la moyenne vers le bas.

Caractéristique de dispersion d’une série statistique : l’étendue

bannière definition

Définition

Étendue :

L’étendue d’une série statistique est la différence entre la plus grande valeur et la plus petite valeur de cette série :

$$\text{Étendue} = \text{Valeur max} - \text{Valeur min}$$

bannière à retenir

À retenir

L’étendue d’une série statistique mesure la dispersion.

  • Plus l’étendue est grande, plus la série est dispersée et hétérogène.
  • Plus l’étendue est petite, plus la série est homogène.
bannière exemple

Exemple

Reprenons l’exemple de l’équipe de rugby.

$$\scriptsize 24\ ; 23\ ; 35\ ; 27\ ; 24\ ; 21\ ; 31\ ; 28\ ; 29\ ; 24\ ; 22\ ; 32\ ; 32\ ; 26\ ; 24\ ; 24\ ; 25\ ; 22\ ; 25\ ; 27\ ; 27\ ; 29\ ; 33$$

La plus petite valeur est $21$.
La plus grande est $35$.

  • L’étendue de cette série est égale à $35 - 21$ soit $14$ ans.

On peut donc dire que, dans cette équipe de rugby, il y a $14$ ans d’écart entre le joueur le plus jeune et le joueur le plus âgé.