Médaille
N°1 pour apprendre & réviser du collège au lycée.
Marianne

Conforme au programme
officiel 2018 - 2019

Médiane et étendue

Déjà plus de

1 million

d'inscrits !

Introduction :

Les caractéristiques d'une série statistique dont le caractère étudié est quantitatif sont des indicateurs qui permettent d'avoir une vue d'ensemble de la série. En 5e, nous avons introduit la notion de moyenne. En 4e, nous allons introduire deux nouvelles caractéristiques : la médiane et l'étendue.

Nous commencerons ce cours par un rappel du vocabulaire statistique. Nous reverrons ensuite les outils d'organisation de données. En distinguant caractéristiques de positon et caractéristiques de dispersion, nous rappellerons d'abord la notion de moyenne puis introduirons les deux nouvelles notions que sont la médiane et l'étendue d'une série statistique.

Vocabulaire

bannière rappel

Rappel

Étudier une série statistique, c'est étudier un caractère dans une population :

  • la population est l'ensemble des individus étudiés ;
  • le caractère est le type de mesure que l'on recueille. Il peut être qualitatif ou quantitatif ;
  • les valeurs sont toutes les valeurs possibles que peut prendre ce caractère ;
  • les données sont toutes les mesures que l'on a recueillies ;
  • l'effectif d'une valeur du caractère est le nombre de fois que cette valeur apparait dans la liste, c'est à dire le nombre d'individus qui possèdent cette valeur du caractère ;
  • l'effectif total de la série est le nombre total d'individus de la population étudiée, c'est-à-dire la somme des effectifs ;
  • la fréquence d'une valeur est le quotient de l'effectif de cette valeur par l'effectif total.
bannière exemple

Exemple

Étude 1
On souhaite se donner une idée de la fréquentation du cinéma par les jeunes de 18 à 25 ans. On demande à 2020 jeunes (dont on vérifie l'âge), pris au hasard dans la rue, le nombre de films qu'ils ont vus durant les 6 derniers mois. Voici les réponses obtenues :

11 - 00 - 11 - 44 - 33 - 11 - 33 - 00 - 55 - 11 - 00 - 66 - 33 - 11 - 55 - 1212 - 00 - 33 - 11 - 44

  • La population étudiée est l'ensemble des 2020 jeunes de 18 à 25 ans pris au hasard dans la rue.
  • Le caractère étudié est le nombre de films vus durant les 6 derniers mois (caractère quantitatif).
  • Les valeurs sont toutes les valeurs prises entre 00 et 1212 (soit 77 valeurs : 00, 11, 33, 44, 55, 66 et 1212).
  • Les données sont tous les résultats obtenus (soit les 2020 données citées dans la série ci-dessus).
  • L'effectif total est le nombre d'individus sur lesquels est faite l'enquête soit 2020.

Par exemple :

  • l'effectif de la valeur 44 est 22 (44 apparaît 22 fois dans la liste : 22 jeunes interrogés ont vu 44 films durant les 6 derniers mois) ;
  • la fréquence de la valeur 44 est 220=110=0,1=10 %\frac{2}{20} = \frac{1}{10} = 0,1 = 10\ \% ; parmi les jeunes interrogés, 10 %10\ \% ont vu 44 films durant les 6 derniers mois.

Organisation des données

Les résultats d'une étude statistique sont le plus souvent rassemblés dans un tableau de données où apparaissent les valeurs, les effectifs, ainsi que les fréquences si nécessaire.

bannière exemple

Exemple

Étude 1
On souhaite se donner une idée de la fréquentation du cinéma par les jeunes de 18 à 25 ans. On demande à 2020 jeunes (dont on vérifie l'âge), pris au hasard dans la rue, le nombre de films qu'ils ont vus durant les 6 derniers mois. Voici les réponses obtenues :

11 - 00 - 11 - 44 - 33 - 11 - 33 - 00 - 55 - 11 - 00 - 66 - 33 - 11 - 55 - 1212 - 00 - 33 - 11 - 44

En effectuant les mêmes calculs que précédemment pour toutes les valeurs de la série, on obtient le tableau de données suivant :

Nombre de films vus les 6 derniers mois

00 11 33 44 55 66 1212 Total

Effectifs

44 66 44 22 22 11 11 2020

Fréquences
(sous forme de quotient)

420\dfrac{4}{20} 620\dfrac{6}{20} 420\dfrac{4}{20} 220\dfrac{2}{20} 220\dfrac{2}{20} 120\dfrac{1}{20} 120\dfrac{1}{20} 2020\dfrac{20}{20}

Fréquences
(sous forme décimale)

0,20,2 0,30,3 0,20,2 0,10,1 0,10,1 0,050,05 0,050,05 11

Fréquences
(sous forme de pourcentage)

20 %20\ \% 30 %30\ \% 20 %20\ \% 10 %10\ \% 10 %10\ \% 5 %5\ \% 5 %5\ \% 100 %100\ \%

Ces différents rappels étant faits, nous pouvons maintenant introduire la notion de caractéristiques d'une série statistique.
Nous distinguerons les caractéristiques de position et les caractéristiques de dispersion.

Caractéristiques de position : moyenne et médiane

Caractéristiques de position

bannière definition

Définition

Caractéristique de position :

Une caractéristique de position est un nombre autour duquel se répartissent les valeurs collectées lors d'une enquête ou d'une série de mesures.

bannière à retenir

À retenir

La moyenne et la médiane sont des caractéristiques de position de la série.

Moyenne

Moyenne

bannière definition

Définition

Moyenne d'une série statistique :

La moyenne d'une série statistique est le quotient de la somme de toutes les données de cette série par l'effectif total.

bannière à retenir

À retenir

  • La moyenne de la série de données n'est pas forcément une des valeurs de la série.
  • La moyenne est toujours comprise entre ces deux valeurs extrêmes.
  • Ce n'est généralement pas la moyenne des deux valeurs extrêmes de la série.
bannière exemple

Exemple

Étude 1
On souhaite se donner une idée de la fréquentation du cinéma par les jeunes de 18 à 25 ans. On demande à 2020 jeunes (dont on vérifie l'âge), pris au hasard dans la rue, le nombre de films qu'ils ont vus durant les 6 derniers mois. Voici les réponses obtenues :

11 - 00 - 11 - 44 - 33 - 11 - 33 - 00 - 55 - 11 - 00 - 66 - 33 - 11 - 55 - 1212 - 00 - 33 - 11 - 44

Pour cette étude, le calcul de la moyenne donne :

1+0+1+4+3+1+3+0+5+1+0+6+3+1+5+12+0+3+1+420=5420=2,7\frac{1+0+1+4+3+1+3+0+5+1+0+6+3+1+5+12+0+3+1+4}{20}= \frac{54}{20} = 2,7

Ce qui peut être analysé ainsi : au total, les 2020 jeunes ont vu 5454 films, ce qui fait une moyenne de 2,72,7 films par jeune.

  • La moyenne, ici 2,72,7, est la valeur que prendrait chacune des données si tous les individus de la population étudiée étaient identiques.

On remarque que :

  • 2,72,7 n'est pas une valeur de la série de données.
  • 2,72,7 est bien compris entre 00 et 1212.
  • 2,72,7 n'est pas égal à la valeur de la moyenne des deux valeurs extrêmes 00 et 1212 : 0+122=6\frac{0+12}{2} = 6 \neq 2,7

Moyenne pondérée

Lorsque des valeurs apparaissent plusieurs fois dans une série de données, on additionne les produits de chaque valeur par son effectif. On parle de valeurs pondérées et de moyenne pondérée.

bannière definition

Définition

Valeur pondérée :

Une valeur pondérée par son effectif est le produit de cette valeur par son effectif.

bannière definition

Définition

Moyenne pondérée :

La moyenne pondérée d'une série statistique est égale à la somme des valeurs pondérées par leurs effectifs respectifs divisée par l'effectif total.

bannière exemple

Exemple

Étude 1
On souhaite se donner une idée de la fréquentation du cinéma par les jeunes de 18 à 25 ans. On demande à 2020 jeunes (dont on vérifie l'âge), pris au hasard dans la rue, le nombre de films qu'ils ont vus durant les 6 derniers mois. Voici les réponses obtenues :

11 - 00 - 11 - 44 - 33 - 11 - 33 - 00 - 55 - 11 - 00 - 66 - 33 - 11 - 55 - 1212 - 00 - 33 - 11 - 44

Par exemple, ici, la valeur 11 est pondérée par son effectif égal à 66, la valeur 44 est pondérée par son effectif égal à 22, etc.

Les valeurs pondérées correspondantes sont respectivement 1×61 \times 6 et 4×24 \times 2.

Ainsi, le calcul de la moyenne pondérée donne :

0×4+1×6+3×4+4×2+5×2+6×1+12×120=6+12+8+10+6+1220=5420=2,7\frac{0\times4+1\times6+3\times4+4\times2+5\times2+ 6\times1+12\times1}{20}= \frac{6+12+8+10+6+12}{20} = \frac{54}{20} = 2,7

  • Nous obtenons bien sûr la même valeur que celle obtenue pour la moyenne.
bannière à retenir

À retenir

Le calcul de la moyenne pondérée est également utilisé pour estimer la moyenne d'une série de données regroupées par classes. On prend alors pour valeurs le centre de chaque intervalle.

La moyenne calculée ainsi est appelée moyenne des classes centrées.

Médiane

bannière definition

Définition

Médiane d'une série statistique :

Les données d'une série étant rangées dans l'ordre croissant, on appelle médiane de cette série une valeur qui partage la série en deux groupes de même effectif.

bannière à retenir

À retenir

  • La médiane est telle qu'il y a au moins la moitié des données inférieures ou égales à cette valeur et au moins la moitié des données supérieures ou égales à cette valeur.
  • Elle est généralement différente de la moyenne de la série.
  • La médiane n'est pas forcément une des valeurs de la série.

MÉTHODOLOGIE

Pour déterminer la médiane d'une série de données :

Dans le cas d'un effectif total pair

  • On classe les données dans l'ordre croissant.
  • On sépare les données en 2 groupes de même effectif.
  • La valeur de la médiane est située entre les 2 valeurs centrales de la série ordonnée.
bannière exemple

Exemple

Cas de l'étude 1 (effectif total égal à 2020)

  • Classons nos données dans l'ordre croissant. On obtient la série ordonnée suivante :
    00 - 00 - 00 - 00 - 11 - 11 - 11 - 11 - 11 - 11 - 33 - 33 - 33 - 33 - 44 - 44 - 55 - 55 - 66 - 1212
  • L'effectif total est égal à 2020. Ainsi, nous pouvons partager cette série en deux groupes de 1010 données chacun : 0000111111dix donneˊes33334455612dix donneˊes\small \underbrace{0 - 0 - 0 - 0 - 1 - 1 - 1 - 1 - 1 - \red 1}{\normalsize \text {dix données}} \red- \underbrace{\red 3 - 3 - 3 - 3 - 4 - 4 - 5 - 5 - 6 - 12}{\normalsize \text {dix données}} Valeurs centrales\red {\overbrace {\text{Valeurs centrales}}}
  • Les 22 valeurs centrales sont la 10e10^{\text e} et la 11e11^{\text e} données, soit 11 et 33.
  • La médiane est donc comprise entre 11 et 33.

Comme on le fera le plus souvent, on choisit pour valeur de la médiane la moyenne des deux valeurs centrales soit 1+32=42=2\frac{1+3}{2} = \frac 42 = 2

  • Une médiane de la série est donc 22, ce qui signifie que :
  • au moins 50 %50\ \% des jeunes ont vu au plus 22 films au cours des 6 derniers mois.
  • au moins 50 %50\ \% des jeunes ont vu au moins 22 films au cours des 6 derniers mois.

Nous constatons que la médiane n'est pas une des valeurs de la série et qu'elle est différente de la moyenne égale à 2,72,7.

Dans le cas d'un effectif total impair

  • On classe les données dans l'ordre croissant.
  • On sépare les données en 2 groupes de même effectif.
  • La valeur de la médiane est la valeur centrale de la série ordonnée.
bannière exemple

Exemple

Cas de l'étude 2
On étudie les notes obtenues à un TP de physique-chimie par les 1313 élèves d'un demi-groupe de 4e.
Voici les notes obtenues :
1212 - 13,513,5 - 1919 - 12,512,5 - 1818 - 1212 - 1818 - 1010 - 1212 - 1919 - 1414 - 1515 - 99

  • Classons nos données dans l'ordre croissant. On obtient la série ordonnée suivante :
    99 - 1010 - 1212 - 1212 - 1212 - 12,512,5 - 13,513,5 - 1414 - 1515 - 1818 - 1818 - 1919 - 1919
  • L'effectif total est égal à 1313. Ainsi, nous pouvons partager cette série en deux groupes de 66 données chacun :
    91012121212,5six donneˊes13,5141518181919six donneˊes\underbrace{9 - 10 - 12 - 12 - 12 - 12,5}{\normalsize \text {six données}} - \red{13,5} - \underbrace{14 - 15 - 18 - 18 - 19 - 19}{\normalsize \text {six données}} Valeur centrale\red{\overbrace{\text{Valeur centrale}}}
  • La valeur centrale est la 7e7^{\text e} donnée, soit 13,513,5. La médiane est donc égale à 13,513,5 ce qui signifie que :
  • au moins 50 %50\ \% des élèves de ce demi-groupe ont eu une note inférieure ou égale à 13,513,5 à ce TP de physique-chimie ;
  • au moins 50 %50\ \% des jeunes de ce demi-groupe ont eu une note supérieure ou égale à 13,513,5 à ce TP de physique-chimie.
bannière à retenir

À retenir

  • Il y a autant de données avant la médiane qu'après la médiane.
  • Lorsque l'effectif total est pair, la médiane est n'importe quel nombre compris entre les deux valeurs centrales. On prend généralement la moyenne des deux.
  • Lorsque l'effectif total est impair, la médiane est la valeur centrale de la série.

Caractéristique de dispersion d'une série statistique : l'étendue

Caractéristiques de dispersion

bannière definition

Définition

Caractéristique de dispersion :

Une caractéristique de dispersion donne une idée de l'éparpillement des valeurs collectées lors d'une enquête ou d'une série de mesures.

bannière à retenir

À retenir

L'étendue est une caractéristique de dispersion de la série.

Étendue

bannière definition

Définition

Étendue d'une série statistique :

L'étendue d'une série statistique est la différence entre la plus grande valeur et la plus petite valeur de cette série : Eˊtendue=Valeur maxValeur min\text{Étendue} = \text{Valeur max} - \text{Valeur min}

bannière exemple

Exemple

Étude 1
La plus petite valeur de cette série est 00, la plus grande est 1212.

  • L'étendue de la série est 120=1212 - 0 = 12
    Les jeunes qui voient le plus de films ont vu 1212 films de plus que ceux qui en voient le moins.

Étude 2
La plus petite valeur de cette série est 99, la plus grande est 1919.

  • L'étendue de la série est 199=1019 - 9 = 10
    Il y a 1010 points d'écart entre la note la plus basse et la note la plus haute à ce TP de physique-chimie.

Conclusion :

Le vocabulaire et l'organisation des données étant maintenant acquis, les points importants à retenir de ce cours sont les notions de moyenne (et de moyenne pondérée), de médiane et d'étendue. Il faut comprendre à quoi servent ces caractéristiques (en tant que caractéristiques de position et caractéristiques de dispersion) et savoir les calculer.