Déjà plus de
1 million
d'inscrits !
Les caractéristiques d'une série statistique
Déjà plus de
1 million
d'inscrits !
Avant de commencer, regarde la vidéo
Introduction :
Les caractéristiques d’une série statistique permettent de « caractériser » cette série en mettant en évidence des informations dont la valeur donne une indication importante, pertinente, sur la série statistique étudiée.
Nous commencerons ce cours par un rappel du vocabulaire statistique. Nous verrons ensuite les outils d’organisation de données. Enfin, nous apprendrons à traiter les informations d’une série en calculant ses caractéristiques de position (moyenne et médiane) puis de dispersion (étendue) et en interprétant les résultats.
Vocabulaire
Prenons un exemple concret.
Dans le cadre d’une étude sur l’âge des joueurs d’une équipe de rugby, on a demandé son âge à chaque joueur. Voici la liste des réponses recueillies (âges en années) :
|
Organisation de données statistiques
Les résultats d’une étude statistique sont souvent rassemblés dans un tableau où apparaissent les valeurs, les effectifs ainsi que les fréquences.
Dans le cas de notre étude, on obtient le tableau suivant :
Âge | Effectif | Fréquence sous forme de quotient | Fréquence sous forme décimale | Fréquence sous forme de pourcentage |
Total |
Un tableau statistique est parfois long et fastidieux à consulter et ne permet pas forcément de se faire une idée globale du résultat de l’étude.
Les caractéristiques d'une série permettent d'avoir une vue d'ensemble de cette série.
Caractéristiques de position d’une série statistique
Moyenne
Moyenne :
La moyenne d’une série statistique est le quotient de la somme de toutes les données de cette série par l’effectif total.
La moyenne indique la valeur que prendrait chacune des données si tous les membres de la population étaient identiques.
Dans notre exemple cela donne :
Pour calculer cette moyenne, on s’est intéressé aux données recueillies dont on a fait la somme, somme que l’on a ensuite divisée par l’effectif total.
On aurait aussi pu utiliser le tableau que nous avons établi et considérer les valeurs pondérées par leur effectif respectif.
Cela aurait donné :
On respecte les priorités opératoires :
Bien évidemment, on obtient la même valeur de moyenne, appelée ici moyenne pondérée.
Médiane
Médiane :
Les données d’une série statistique étant rangées dans l’ordre croissant, on appelle médiane de cette série un nombre qui partage la série en deux groupes de même effectif.
Reprenons notre exemple et classons d’abord nos données dans l’ordre croissant.
On obtient :
On dispose d’un effectif total de données.
On peut donc partager cette série en deux groupes de données, et la valeur centrale sera la donnée.
On peut donc dire qu’au moins des joueurs ont un âge inférieur ou égal à ans.
En général, la médiane est différente de la moyenne.
Ici, la moyenne d’âge des joueurs ( ans) est supérieure à la médiane ( ans). Cela s’explique par le fait que les joueurs les plus âgés sont beaucoup plus âgés. Ils « tirent » la moyenne vers le haut.
Prenons un autre exemple.
On demande à un élève de faire germer lentilles et de mesurer la taille des germes au bout d’une semaine de germination. On lui demande également de calculer la moyenne et la médiane des résultats obtenus.
Voici les mesures effectuées par l’élève au bout de jours (en centimètres) : |
Pour obtenir la taille moyenne, on fait la somme des données et on divise par l’effectif total :
Pour calculer la médiane, on classe d’abord les données dans l’ordre croissant :
On dispose ici d’un effectif total de données.
On peut donc partager cette série en deux groupes de données, les valeurs centrales étant la et la données.
La médiane est donc comprise entre les valeurs et .
On choisit de prendre la moyenne des deux soit :
On peut donc dire qu’au moins des germes ont une taille inférieure ou égale à . Ou, mieux encore dans ce cas, au moins des germes ont une taille supérieure ou égale à .
Cette médiane est plus élevée que la moyenne car les plus petits germes sont vraiment petits. Ils « tirent » la moyenne vers le bas.
Caractéristique de dispersion d’une série statistique : l’étendue
Étendue :
L’étendue d’une série statistique est la différence entre la plus grande valeur et la plus petite valeur de cette série :
L’étendue d’une série statistique mesure la dispersion.
Reprenons l’exemple de l’équipe de rugby.
La plus petite valeur est .
La plus grande est .
On peut donc dire que, dans cette équipe de rugby, il y a ans d’écart entre le joueur le plus jeune et le joueur le plus âgé.