Caractéristiques d'une série statistique
Vocabulaire
Vocabulaire
- En statistiques, la liste de données est appelée série de données statistique.
- Étudier une série statistique correspond à l’étude d’un caractère (type de mesure) dans une population (ensemble étudié).
- Les données sont toutes les mesures que l’on a recueillies.
- L’effectif d’une valeur est le nombre de fois que cette valeur apparaît dans la liste.
- L’effectif total est le nombre de données recueillies (soit la somme des effectifs).
- La fréquence d’une valeur est le quotient de l’effectif de cette valeur par l’effectif total. Elle peut être laissée sous forme de fraction ou donnée sous forme décimale ou de pourcentage.
- Les résultats d’une étude statistique sont souvent rassemblés dans un tableau où apparaissent les valeurs, les effectifs ainsi que les fréquences.
Caractéristiques de position
Caractéristiques de position
Moyenne d’une série de données numériques :
La moyenne d’une série de données numériques est égale à la somme de toutes les données, divisée par l’effectif total :
$$\text{moyenne}=\dfrac{\text{somme des données}}{\text{effectif total}}$$
Moyenne pondérée :
La moyenne pondérée d’une série statistique numérique est égale à la somme des produits de chaque valeur par son effectif, divisée par l’effectif total :
$$\text{moyenne pondérée}=\dfrac{\text{somme des produits des valeurs par leurs effectifs}}{\text{effectif total}}$$
Médiane d’une série statistique :
Les données d’une série numérique étant rangées dans l’ordre croissant, on appelle médiane de cette série une valeur qui la partage en deux groupes de même effectif.
- En général, la médiane est différente de la moyenne.
Pour déterminer la médiane :
- Si l’effectif total est impair : la médiane est la valeur centrale de la série rangée dans l’ordre croissant.
- Si l’effectif total est pair : la médiane est la moyenne des deux valeurs centrales de la série rangée dans l’ordre croissant.
Le mode d’une série statistique est la valeur qui apparaît le plus fréquemment dans la série. Il donne une indication sur la valeur la plus représentative du point de vue de la fréquence.
Caractéristique de dispersion
Caractéristique de dispersion
Étendue d’une série statistique :
L’étendue d’une série statistique est la différence entre la plus grande valeur et la plus petite valeur de cette série :
$$\text{Étendue} = \text{Valeur max} - \text{Valeur min}$$
- Quand l’étendue est grande, cela signifie que la série est dispersée et hétérogène.
- Quand l’étendue est petite, cela signifie que la série est regroupée et homogène.
Regroupement par classes
Regroupement par classes
Quand, dans une série de données numériques, il y a de très nombreuses valeurs différentes, on peut les regrouper en classes, c’est-à-dire en intervalles de valeurs.
- On compte alors le nombre de valeurs qui appartiennent à chaque classe et on récapitule les effectifs.
- Pour représenter des données regroupées en classes, on peut faire un histogramme (un graphique).
Amplitude d’une classe :
L’amplitude d’une classe est égale à la différence entre la valeur la plus grande de la classe et la plus petite.
Pour calculer une moyenne lorsque les données sont regroupées par classe :
- on détermine le centre de chaque classe, qui est égal à la moyenne entre les valeurs extrêmes de la classe ;
- on calcule ensuite la moyenne pondérée en prenant comme valeurs les centres des classes.