Déjà plus de
1 million
d'inscrits !
Intervalle de fluctuation, prise de décision et estimation
Déjà plus de
1 million
d'inscrits !
Avant de commencer, regarde les vidéos suivantes
Introduction :
L’échantillonnage est l’étude d’une partie contenue dans un tout, une branche des statistiques. Ce cours introduira de nouvelles définitions, propriétés, théorèmes et exemples d’applications.
Intervalle de fluctuation asymptotique
Soit une variable aléatoire suivant une loi binomiale , un réel tel que et une variable aléatoire suivant la loi normale centrée réduite .
On appelle l’unique réel tel que :
On appelle l’intervalle :
Alors :
Intervalle de fluctuation :
L’intervalle contient la fréquence avec une probabilité qui se rapproche de lorsque augmente.
On dit que c’est un intervalle de fluctuation asymptotique de au seuil de .
Cette approximation est valable lorsque , et .
Le pourcentage de personnes obèses en France est de 12,4 %. On cherche à déterminer un intervalle de fluctuation asymptotique de la fréquence des personnes obèses dans une entreprise de salariés :
On arrondira les bornes de l’intervalle à près.
donc
Il faut donc déterminer tel que où suit la loi normale centrée réduite.
Or, on sait que : .
On a donc : .
Avec la calculatrice :
Finalement, on utilise la formule suivante :
, en arrondissant toujours la borne inférieure par défaut et la borne supérieure par excès.
Cela veut dire que la fréquence des gens obèses dans l’entreprise est comprise entre 11,2 % et 13,6 %, avec un risque de 20 % de se tromper.
donc .
Il faut donc déterminer tel que où suit la loi normale centrée réduite.
En utilisant la même méthode, on obtient
Finalement, on utilise la formule suivante :
, en arrondissant toujours la borne inférieure par défaut et la borne supérieure par excès.
Cela veut dire que la fréquence des gens obèses dans l’entreprise est comprise entre 10,1 % et 14,7 %, avec un risque de 1 % de se tromper.
L’intervalle de fluctuation asymptotique au seuil de 95 % pour une variable aléatoire suivant une loi binomiale est l’intervalle : .
Pour ce seuil de 95 %, inutile de montrer que , il est possible de s’en servir directement.
L’intervalle de fluctuation au seuil de 95 % est un intervalle qui contient au moins 95 % des fréquences observées dans les échantillons de taille .
Prise de décision à partir d’un échantillon
On considère une population dans laquelle on suppose que la proportion d’un caractère est égale à . On observe la fréquence de ce caractère dans un échantillon de taille .
On a donc l’hypothèse : « la proportion de ce caractère dans la population est ».
Si est l’intervalle de fluctuation de la fréquence au seuil de 95 % dans les échantillons de taille , alors on applique la règle de décision suivante :
Selon la théorie de Mendel, certaines cosses de petits pois devraient fournir des petits pois jaunes et verts dans les proportions respectives de 75 % et 25 %. On souhaite tester l’hypothèse selon laquelle la proportion des pois jaunes est en mettant en place une expérience sur 224 petits pois considérés comme un échantillon aléatoire. L’expérience a permis d’obtenir 176 pois jaunes et 48 pois verts.
, on accepte donc l’hypothèse avec un risque de 5 % de se tromper.
Estimation
Intervalle de confiance
est une variable aléatoire qui suit la loi binomiale et
Pour une valeur de fixée dans , l’intervalle aléatoire contient, pour assez grand, la proportion avec une probabilité supérieure ou égale à .
Intervalle de confiance :
Soit la proportion inconnue d’un caractère dans une population.
On réalise l’expérience aléatoire de tirages au hasard et on appelle la fréquence observée d’apparition du caractère.
L’intervalle est appelé intervalle de confiance de la proportion inconnue au niveau de confiance .
On dispose d’une urne contenant un très grand nombre de boules rouges et bleues. On ignore quelle est la proportion de boules rouges dans l’urne et rien ne permet de faire une hypothèse sur la valeur de .
On procède donc à une estimation de en réalisant un tirage de boules. Lors de ce tirage, on obtient boules rouges et bleues.
.
est donc un intervalle de confiance à de la proportion de boules rouges dans l’urne.
Précision d’une estimation et taille de l’échantillon
Un intervalle de confiance au niveau 95 % est d’amplitude donc, plus la taille de l’échantillon est grande, plus l’intervalle de confiance obtenu est précis.
Si l’on souhaite situer dans un intervalle de longueur donnée , alors on doit avoir ce qui équivaut à .
À l’occasion d’une élection, on réalise un sondage sur un échantillon de personnes afin de connaître le pourcentage d’électeurs qui souhaitent voter pour un candidat donné. On suppose la population suffisamment importante pour que ce sondage soit assimilé à un tirage avec remise.
Le but est de trouver la taille minimale de l’échantillon afin que l’intervalle de confiance de cette proportion donne celle-ci à 1 % près avec une probabilité au moins égale à 0,95 %.
On sait que l’amplitude d’un intervalle de confiance au niveau 95 % est et pour avoir une précision à 1 % près, soit à près, on doit avoir un intervalle de confiance d’amplitude .
On cherche donc tel que :
Un intervalle centré en fournit à la précision si son amplitude est .
Bien vérifier si l’énoncé donne la précision avec laquelle on souhaite obtenir ou bien l’amplitude (c’est-à-dire la taille) de l’intervalle.