Déjà plus de
1 million
d'inscrits !
Déjà plus de
1 million
d'inscrits !
Introduction :
La statistique est un ensemble de méthodes qui permettent le rassemblement, l’organisation et l’interprétation de données obtenues par l’observation d’activités de la vie courante ou en milieu professionnel.
Dans ce cours, nous allons voir comment organiser ces données et les interpréter à l’aide de paramètres statistiques centraux, tels que la médiane et la moyenne, ou de paramètres statistiques de dispersion, comme l’intervalle interquartile et l’écart type.
La médiane
On considère un ensemble de valeurs d’une série statistique rangées dans l’ordre croissant.
Médiane :
La médiane d’une série statistique de valeurs ordonnées est la valeur qui sépare cette série en deux groupes de même effectif.
Deux cas sont possibles : soit est pair, soit est impair.
La médiane d’une série statistique est telle que :
Considérons la série composée de valeurs, est impair :
La médiane est la valeur centrale, donc .
Considérons la série composée de valeurs, est pair :
La médiane est la valeur moyenne des deux valeurs centrales et donc .
Les quartiles
On considère un ensemble de valeurs d’une série statistique rangées dans l’ordre croissant comportant une valeur minimale () et une valeur maximale (). Pour une série statistique donnée, il existe trois quartiles : , et .
Quartile :
En statistique descriptive, le terme « quartile » désigne chacune des trois valeurs qui divisent la série de données en quatre parts égales.
Premier quartile () :
On appelle premier quartile la plus petite valeur d’une série statistique, notée , telle qu’au moins des valeurs de la série soient inférieures ou égales à .
Deuxième quartile () :
Le deuxième quartile d’une série statistique est égal à la médiane de cette série.
Troisième quartile () :
On appelle troisième quartile la plus petite valeur de la série statistique, notée , telle qu’au moins des valeurs de la série soient inférieures ou égales à .
Reprenons la série statistique vue précédemment.
La position ou le rang du premier quartile de la série à valeurs est le plus petit entier supérieur ou égal à , soit la troisième valeur de la série.
Le deuxième quartile est égal à la médiane de la série.
La position ou le rang du troisième quartile de la série à valeurs est le plus petit entier supérieur ou égal à , soit la neuvième valeur de la série.
Considérons maintenant la série statistique ci-dessous comportant valeurs. Ce sont les notes obtenues par des élèves de mathématiques en classe de seconde.
Notes | ||||||
Effectifs |
La position ou le rang du premier quartile de la série à valeurs est le plus petit entier supérieur ou égal à , soit le sixième élève.
Le deuxième quartile , ou la médiane, est la note du douzième élève ( étant la valeur centrale de la série).
La position ou le rang du troisième quartile de la série à valeurs est le plus petit entier supérieur ou égal à , soit le dix-huitième élève.
Écart interquartile :
On nomme écart interquartile la différence entre et .
L’intervalle interquartile est .
Au moins des valeurs de la série statistique sont comprises dans .
La moyenne pondérée
Il ne faut pas confondre médiane et moyenne !
Pour saisir la différence entre ces deux paramètres statistiques centraux, il faut penser à un ensemble de valeurs rangées dans l’ordre croissant :
Il existe plusieurs types de moyenne. Dans ce qui suit, nous allons définir la moyenne pondérée.
Moyenne pondérée :
La moyenne pondérée est la moyenne d'un certain nombre de valeurs affectées de coefficients.
On considère une série statistique d’effectif total tel que et donnée par le tableau suivant.
Valeurs | … | ||||
Effectifs | … |
La moyenne pondérée de la série statistique donnée dans le tableau ci-dessus est :
Considérons le nombre d’heures passées par jour par un adolescent sur les réseaux sociaux pendant un mois.
Heures par jour | |||||||
Nombre de jours |
On calcule la moyenne pondérée :
Le nombre moyen d’heures passées par jour par cet adolescent sur les réseaux sociaux est donc d’environ heures.
Linéarité de la moyenne :
Un professeur de mathématiques a noté sur ses élèves lors d’un contrôle sur les statistiques.
La moyenne de la classe est de sur . Le professeur veut reporter cette note sur .
Cela revient à calculer la moyenne de la classe où chaque élève sera noté sur . Pour cela, il suffit de multiplier chaque note par et de calculer la nouvelle moyenne.
D’après la première propriété ci-dessus, il suffit de prendre l’ancienne moyenne et de la multiplier par .
Un autre professeur a noté ses élèves lors d’un contrôle sur les statistiques.
La moyenne de la classe est de sur , mais le professeur a oublié points dans la note de chaque élève.
Il lui faut alors ajouter points à la note de chaque élève puis calculer la nouvelle moyenne.
Or, d’après la deuxième propriété ci-dessus, il lui suffit d’ajouter points à l’ancienne moyenne pour obtenir la nouvelle moyenne.
L’écart type
Écart type :
L’écart type d’une série statistique, noté , est égal à la racine carrée de la moyenne des carrés des écarts de valeurs à la moyenne de la série statistique.
Plus simplement :
Valeurs | … | ||||
Effectifs | … |
Avec , l’écart type est égal à :
L’écart type est un nombre positif. Plus ce nombre est grand, plus les valeurs sont dispersées autour de la moyenne.
Considérons les résultats obtenus lors d’une évaluation par deux classes A et B d’élèves de seconde.
Classe A :
Notes | ||||||
Effectifs |
Classe B :
Notes | ||||||
Effectifs |
Les deux classes ont obtenu la même moyenne : .
Calculons les écarts types pour chaque série.
Conclusion :
Nous avons vu dans ce cours que les indicateurs statistiques que sont la moyenne ou la médiane d’une série statistique composée de plusieurs valeurs indiquent autour de quel nombre se situent ces valeurs. En revanche, les indicateurs tels que l’écart interquartile et l’écart type indiquent si ces valeurs sont plus ou moins dispersées.
Avec tous ces indicateurs, vous pouvez dorénavant comparer plusieurs séries statistiques.