Calculer une moyenne et une moyenne pondérée

Introduction :

Lorsque le caractère étudié lors d'une enquête ou d'une série de mesures est quantitatif, différentes caractéristiques permettent d'avoir une vue d'ensemble de la série statistique pour interpréter des résultats ou pour comparer des séries entre elles. La moyenne est une de ces caractéristiques.

Nous commencerons ce cours par un rappel du vocabulaire des statistiques avant d'introduire l'exemple qui nous servira durant tout le cours. Nous définirons ensuite la moyenne d'une série statistique, puis nous aborderons également de la notion de valeurs et de moyenne pondérées.

Vocabulaire

bannière rappel

Rappel

La listes des données collectées lors d'une enquête ou d'une série de mesures est appelée série de données statistique.

Étudier une série statistique, c'est étudier un caractère dans une population :

  • la population est l'ensemble des individus étudiés ;
  • le caractère est le type de mesure que l'on recueille ; il peut être :
  • qualitatif (couleur des yeux, marque de sa voiture, de son téléphone portable…),
  • ou quantitatif (poids, nombre de voitures au domicile, temps passé au téléphone…) ;
  • les valeurs sont toutes les valeurs possibles que peut prendre ce caractère ;
  • les données sont toutes les mesures que l'on a recueillies ;
  • l'effectif d'une valeur du caractère est le nombre de fois que cette valeur apparaît dans la liste, c'est-à-dire le nombre d'individus qui possèdent cette valeur du caractère ;
  • l'effectif total de la série est le nombre total d'individus de la population étudiée, c'est-à-dire la somme des effectifs ;
  • la fréquence d'une valeur est le quotient de l'effectif de cette valeur par l'effectif total.
bannière exemple

Exemple

Nous avons demandé à $25$ élèves de 5e le temps qu'ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine.

Voici les réponses obtenues en nombre d'heures :
$2$ - $4$ - $0$ - $0,5$ - $1,5$ - $2$ - $2,5$ - $3$ - $2,5$ - $0$ - $0,75$ - $4$ - $5$ - $3$ - $1,5$ - $1$ - $2$ - $3,5$ - $1,5$ - $1$ - $2,5$ - $3,5$ - $2$ - $2,5$ - $2$.

Dans cette série statistique :

  • la population étudiée est une classe de 5e ;
  • le caractère étudié est le nombre d'heures de sport effectuées ;
  • c'est un caractère quantitatif ;
  • les valeurs possibles du caractère sont toutes les valeurs comprises entre $0$ et $5$ heures.
  • les données sont toutes les réponses recueillies.
  • l'effectif total est le nombre d'élèves interrogés, soit $25$.

Par exemple, l'effectif de la valeur « $2$ » est $5$.

  • « $2$ » apparaît $5$ fois dans la liste, donc $5$ élèves font $2$ heures de sport par semaine.

Sa fréquence est : $$\dfrac{\text{Effectif de la valeur “2”}}{\text{Effectif total}}=\dfrac{5}{25}=0,2=20\ \%$$

  • $20\ \%$ des élèves de cette classe font $2$ heures de sport par semaine.

Si nous effectuons les mêmes calculs pour toutes les valeurs de la série, nous obtenons les résultats que nous pouvons regrouper dans le tableau ci-dessous :

tableau statistique mathématiques cinquième

Ces rappels étant faits, nous pouvons maintenant introduire les notions de moyenne et de moyenne pondérée d'une série statistique.

Moyenne et moyenne pondérée

Lorsque le caractère étudié lors d'une enquête ou d'une série de mesures est quantitatif, la moyenne est une des caractéristiques (indicateurs) de la série.

Moyenne

bannière definition

Définition

Moyenne :

La moyenne d'une série statistique est égale à la somme de toutes les données de cette série divisée par l'effectif total.

bannière à retenir

À retenir

  • La moyenne indique la valeur que prendrait chacune des données si tous les individus de la population étaient identiques.
  • La moyenne est toujours comprise entre les deux valeurs extrêmes.
  • La moyenne de la série de données n'est pas forcément une des valeurs de la série.
  • Ce n’est généralement pas la moyenne des deux valeurs extrêmes de la série (la plus petite et la plus grande).
bannière exemple

Exemple

Nous avons demandé à $25$ élèves de 5e le temps qu'ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine.

Voici les réponses obtenues en nombre d'heures :
$2$ - $4$ - $0$ - $0,5$ - $1,5$ - $2$ - $2,5$ - $3$ - $2,5$ - $0$ - $0,75$ - $4$ - $5$ - $3$ - $1,5$ - $1$ - $2$ - $3,5$ - $1,5$ - $1$ - $2,5$ - $3,5$ - $2$ - $2,5$ - $2$.

Ici, le calcul de la moyenne donne :

$\begin{aligned}\small \text{M}&=\tiny \frac{2 + 4 + 0 + 0,5 + 1,5 + 2 + 2,5 + 3 + 2,5 + 0 + 0,75 + 4 + 5 + 3 + 1,5 + 1 + 2 + 3,5 + 1,5 + 1 + 2,5 + 3,5 + 2 + 2,5 + 2}{25}\\ \small \text{M}&\small=\frac{53,75}{25}\\ \small \text{M}&\small=2,15\end{aligned}$

  • Ce qui signifie qu'en moyenne, un élève de cette classe de 5e fait $2,15$ heures de sport par semaine.
  • On remarque que $2,15$ est bien compris entre $0$ et $5$ : $0< 2,15 <5$
  • On remarque également que $2,15$ n'est pas une des valeurs de la série de données.
  • La moyenne de la série n'est pas non plus égale à la moyenne des deux valeurs extrêmes qui sont $0$ et $5$ : $\frac{0+5}{2} = 2,5 \neq 2,15$

Moyenne pondérée

Les données recueillies peuvent être nombreuses, et en faire la somme est un travail long qui peut être source d'erreur.
Lorsque des valeurs apparaissent plusieurs fois, il est plus simple d'additionner les produits de chaque valeur par son effectif.

  • On parle alors de valeurs pondérées et de moyenne pondérée.
bannière definition

Définition

Valeur pondérée :

Une valeur pondérée par son effectif est le produit de cette valeur par son effectif.

bannière definition

Définition

Moyenne pondérée :

La moyenne pondérée d'une série statistique est égale à la somme des valeurs pondérées par leur effectif respectif divisée par l'effectif total.

bannière exemple

Exemple

Nous avons demandé à $25$ élèves de 5e le temps qu'ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine.

Voici les réponses obtenues en nombre d'heures :
$2$ - $\green 4$ - $\red 0$ - $0,5$ - $\blue {1,5}$ - $2$ - $2,5$ - $3$ - $2,5$ - $\red 0$ - $0,75$ - $\green 4$ - $5$ - $3$ - $\blue {1,5}$ - $1$ - $2$ - $3,5$ - $\blue {1,5}$ - $1$ - $2,5$ - $3,5$ - $2$ - $2,5$ - $2$.

Ici :

  • la valeur $\red 0$ est pondérée par $\purple 2$ (autrement dit, la valeur $\red 0$ apparaît $\purple 2$ fois),
  • la valeur $\blue {1,5}$ est pondérée par $\purple 3$ (autrement dit, la valeur $\blue {1,5}$ apparaît $\purple 3$ fois),
  • la valeur $\green 4$ est pondérée par $\purple 2$ (autrement dit, la valeur $\green 4$ apparaît $\purple 2$ fois)…

Les valeurs pondérées correspondantes sont donc respectivement :

  • $\red{0}\purple{\times2}$
  • $\blue{1,5}\purple{\times3}$
  • $\green 4\purple{\times2}$.

On fait de même pour toutes les valeurs.
Ainsi, le calcul de la moyenne pondérée donne :

$\begin{aligned}\small\text{M}&=\tiny\frac{0\times2+0,5\times1+0,75\times1+1\times2+1,5\times3+2\times5+2,5\times4+3\times2+3,5\times2+4\times2+5\times1}{25}\\ \small\text{M}&\small=\dfrac{0,5+0,75+2+4,5+10+10+6+7+8+5}{25}\\ \small\text{M}&\small=\dfrac{53,75}{25}\\ \small\text{M}&\small=2,15\end{aligned}$

  • Nous obtenons bien évidemment la même valeur que celle obtenue pour la moyenne : $2,15$.

Moyenne des classes centrées

Lorsque les données sont regroupées par classe, une méthode d'estimation de la moyenne consiste à calculer la moyenne pondérée des valeurs prises par le centre de chaque intervalle.

bannière exemple

Exemple

Nous avons demandé à $25$ élèves de 5e le temps qu'ils consacrent à la pratique du sport (hors heures obligatoires du collège) par semaine.

Voici les réponses obtenues en nombre d'heures :
$2$ - $4$ - $0$ - $0,5$ - $1,5$ - $2$ - $2,5$ - $3$ - $2,5$ - $0$ - $0,75$ - $4$ - $5$ - $3$ - $1,5$ - $1$ - $2$ - $3,5$ - $1,5$ - $1$ - $2,5$ - $3,5$ - $2$ - $2,5$ - $2$.

Si on regroupe les données de notre étude par classes d'intervalle $1$, voici le tableau des effectifs (les fréquences n'intervenant pas dans le calcul des moyennes) que nous obtenons :

$n$ = Nombre d’heures de sport par semaine

$0\leq n<1$ $1\leq n<2$ $2\leq n<3$ $3\leq n<4$ $4\leq n<5$ Total

Effectifs

$4$ $5$ $9$ $4$ $3$ $25$

En prenant pour valeurs le centre de chaque intervalle, notre tableau des effectifs devient :

$n$ = Nombre d’heures de sport par semaine

$0,5$ $1,5$ $2,5$ $3,5$ $4,5$ Total

Effectifs

$4$ $5$ $9$ $4$ $3$ $25$

Le calcul de la moyenne des classes centrées est alors un calcul de moyenne pondérée qui donne :

$\begin{aligned}\small\text{M}&=\small\frac{0,5\times 4+1,5\times 5+2,5\times 9+3,5\times 4+4,5\times 3}{25}\\ \small\text{M}&= \frac{2+7,5+22,5+14+13,5}{25}\\ \small\text{M}&= \frac{59,5}{25}\\ \small\text{M}&=2,38\end{aligned}$

  • La moyenne des classes centrées est donc égale à $2,38$ heures de sport par semaine.

La moyenne exacte calculée plus haut est égale à $2,15$ heures de sport par semaine.

Ainsi, l'écart entre la moyenne estimée et la moyenne exacte est de $2,38 - 2,15$ soit $0,23$ heure, soit moins d'$\frac 14$ d’heure ($0,25$ heure étant exactement égal à $\frac 14$ d’heure).

bannière à retenir

À retenir

L'estimation de la moyenne par la méthode des classes centrées est plutôt fiable.

Conclusion :

Dans ce cours, nous avons introduit une nouvelle notion de la statistique : la moyenne. Elle prend ici un sens purement mathématique et rigoureux, mais c'est une notion que nous utilisons dans la vie de tous les jours (« en moyenne », « généralement », « ma moyenne est de… ») et qui nous permet de situer, de positionner un élément par rapport à un ensemble (une note par rapport à la moyenne de la classe) ou un ensemble par rapport à un autre (la moyenne d'une classe par rapport à celle d'une autre classe), de donner un ordre d'idée d'une valeur ou d'avoir une vue globale sur un sujet.