Statistiques
Introduction :
Dans ce cours, nous verrons comment trouver et organiser des informations mathématiques (que l’on appelle des données) pour ensuite les utiliser et en tirer des conclusions.
Savoir organiser et analyser des données est très utile en mathématique, mais cette notion sera aussi très utilisée dans les autres matières.
Qu’est-ce qu’une donnée ?
Qu’est-ce qu’une donnée ?
En mathématiques, une donnée, c’est un fait, un nombre, une observation ou une mesure qui sert de base pour une analyse ou une discussion.
Ces données peuvent être numériques (exemple : ton âge) ou descriptives (exemple : ta couleur préférée).
Elles constituent le point de départ de l'étude statistique et peuvent être brutes ou déjà traitées.
Recueillir des données
Recueillir des données
Pour recueillir des données, on peut :
- créer un questionnaire (exemple : demander à chaque élève de la classe quelle est sa couleur préférée) ;
- faire une expérimentation (mesurer chaque élève de la classe pour connaitre sa taille) ;
- chercher les informations dans un texte, un tableau ou un graphique déjà créé (exemple : prendre les dates de naissances enregistrées dans le logiciel du collège pour connaitre l’âge des élèves).
L’important est de vérifier que la source de donnée est fiable (c’est-à-dire sans erreur) et que les données choisies permettent bien de répondre à la question que l’on se pose.
Un peu de vocabulaire pour décrire des données
Un peu de vocabulaire pour décrire des données
Quand on décrit des données, on a besoin de 4 informations :
- la population étudiée (exemple : la classe de 6A, toutes les classes d’un collège, tous les habitants d’une région…) ;
- le caractère étudié, c’est-à-dire ce que l’on observe (exemple : la taille, l’âge, la couleur…) ;
- la modalité, autrement dit les différentes valeurs possibles d’un caractère :
- exemple pour la couleur : rouge, vert, bleu, etc.,
- exemple pour la taille : on peut choisir de garder toutes les tailles possibles (1,32 m, 1,46 m…) ou créer des classes (moins de 1,30 m, de 1,30 m à 1,39 m…) ;
- l’effectif, c’est-à-dire le nombre de fois ou une modalité est observée (exemple : 3 élèves de la classe ont choisi « orange » comme couleur préférée).
Présenter et lire des données
Présenter et lire des données
Tableau à une entrée
Tableau à une entrée
Dans un collège, le principal adjoint note dans un tableau le nombre d'élèves de chaque niveau, à l'exception de celui de 4e qu'il ne parvient pas à trouver.
Niveau | 6e | 5e | 4e | 3e | Total |
Effectif | $102$ | $96$ | $…$ | $84$ | $374$ |
On peut lire dans ce tableau le nombre d'élèves de 6e de ce collège : $102$.
Par calcul, on peut obtenir le nombre d'élèves de 4e de ce collège :
$374 - (102 + 96 + 84) = 374 - 282 = 92$
On peut également déduire de ce tableau qu'il y a plus d'élèves en 6e qu'en 3e dans ce collège :
$102 > 84$
Tableau à double entrée
Tableau à double entrée
Le tableau précédent devient un tableau à double entrée si nous étudions un deuxième critère en relation avec le premier (ici le niveau des élèves de ce collège). Par exemple, prenons le régime des élèves : demi-pensionnaire ou externe.
Niveau →
Régime ↓ |
6e | 5e | 4e | 3e | Total |
Demi-pensionnaire | $75$ | $\red{78}$ | $73$ | $69$ | $295$ |
Externe | $\green {27}$ | $…$ | $\green{19}$ | $\green{15}$ | $\green{79}$ |
Total | $102$ | $\red{96}$ | $92$ | $84$ | $374$ |
On peut voir dans ce tableau qu'en 5e dans ce collège, $78$ élèves sont demi-pensionnaires, ou bien qu'en 3e, $15$ élèves sont externes.
Par calcul, on peut également obtenir le nombre d'élèves externes en 5e dans ce collège :
$\red{96} - \red{78} = 18$ ou bien $\green{79} - (\green{27} + \green{19} + \green{15}) = 79 - 61 = 18$
On peut également déduire de ce tableau qu'il y a plus d'élèves demi-pensionnaires en 5e qu'en 6e dans ce collège : $78>75$
Les courbes
Les courbes
Pour mieux visualiser les données, on peut aussi les présenter dans un graphique. Une courbe associe chaque donnée à un point et permet de voir facilement les évolutions.
Pour suivre la popularité d’un prénom Sur le graphique suivant, on voit facilement que le prénom Cécile a été très à la mode dans les années 70, mais ne l’est plus du tout aujourd’hui. On voit aussi qu’il y a eu beaucoup moins de Cécile entre 1914 et 1918, car il y a eu beaucoup moins de naissances à cause de la première guerre mondiale !
REMARQUE
L’INSEE est l’Institut Nationale de la Statistique et des Etudes Economiques. Tu peux trouver sur leur site des données fiables sur la France et l’Europe, et beaucoup d’outils pour les visualiser.
Les diagrammes en barre
Les diagrammes en barre
Les diagrammes en barre sont très efficaces pour comparer différentes catégories de données. Chaque modalité est représentée par une barre, dont la hauteur (ou la longueur) est proportionnelle à l’effectif.
Sur le graphique ci-dessous, on voit rapidement que les émissions de gaz à effet de serre associées à la consommation de bœuf sont beaucoup plus importantes que celles associées à la consommation de poulet, qui elles-mêmes sont bien plus importantes que celles associées à la consommation de n’importe quel légume.
Les diagrammes circulaires
Les diagrammes circulaires
Les diagrammes circulaires permettent de montrer la répartition d’un tout. L’angle au centre du disque couvert par chaque part est proportionnel à l’effectif de la modalité. [EX] Sur le graphique ci-dessous, on voit que la plus grande cause de l’effondrement de la biodiversité est dû à la destruction et l’artificialisation des milieux naturels.
- Exotique : qui provient de pays lointains, notamment tropicaux
- Espèce invasive : espèce envahissante qui remplace les espèces locales
- Artificialisation : disparition d’espaces naturelles sous des constructions
Conclusion :
Les statistiques sont très utiles présenter une situation et clarifier des données. Nous avons vu que pour avoir des don nées, il faut soit les compiler soi-même (questionnaires, expérimentations, etc.), soit s’assurer que les sources sont fiables lorsqu’on utilise des données déjà faites, dans le cadre d’études par exemple. Ensuite, on peut utiliser des tableaux pour organiser les données, et des diagrammes ou courbes pour les rendre plus facile à lire, selon ce sur quoi on met l’accent (comparaison, évolution, part d’un tout, etc.).