Intervalle de fluctuation, prise de décision et estimation

Intervalle de fluctuation asymptotique

Propriété :

Soit $X_n$ une variable aléatoire suivant une loi binomiale $B(n,p)$, $\alpha$ un réel tel que $0<\alpha < 1$ et $Y$ une variable aléatoire suivant la loi normale centrée réduite $N(0,1)$.

  • On appelle $u_{\alpha}$ l’unique réel tel que : $P(-u_{\alpha} \leq Y \leq u_{\alpha}) = 1 - \alpha$
  • On appelle $I_n$ l’intervalle :

$I_n = \left[p-u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}};p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$

Alors $\lim\limits_{n \rightarrow +\infty} p \left( \dfrac{X_n}{n} \in I_n \right) = 1 - \alpha$

Définition : intervalle de fluctuation

L’intervalle $I_n = \left[p-u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}};p+u_{\alpha}\dfrac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$ contient la fréquence $F_n = \dfrac{X_n}{n}$ avec une probabilité qui se rapproche de $1 - \alpha$ lorsque $n$ augmente.

On dit que c’est un intervalle de fluctuation asymptotique de $F_n$ au seuil de $1 - \alpha$.

Cette approximation est valable lorsque $n \geq 30$, $np \geq 5$ et $n(1-p) \geq 5$.

Propriété :

L’intervalle de fluctuation asymptotique au seuil de 95 % pour une variable aléatoire $X_n$ suivant une loi binomiale $B(n,p)$ est l’intervalle : $I_n = \left[p-1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}};p+1,96\dfrac{\sqrt{p(1-p)}}{\sqrt{n}} \right]$.

Prise de décision à partir d’un échantillon

Propriété :

On considère une population dans laquelle on suppose que la proportion d’un caractère est égale à $p$. On observe la fréquence $f$ de ce caractère dans un échantillon de taille $n$.

On a donc l’hypothèse : « la proportion de ce caractère dans la population est $p$ ».

Si $I$ est l’intervalle de fluctuation de la fréquence au seuil de 95 % dans les échantillons de taille $n$, alors on applique la règle de décision suivante :

  • si $f \in I$, on considère que l’hypothèse selon laquelle la proportion est $p$ dans la population n’est pas remise en question, et on l’accepte, avec un risque de 5% de se tromper,
  • si $f \notin I$, on rejette l’hypothèse selon laquelle cette proportion est $p$.

Estimation

Propriété : intervalle de confiance

$X_n$est une variable aléatoire qui suit la loi binomiale $B(n\ ;p)$ et $F_n = \dfrac{X_n}{n}$.

Pour une valeur de $p$ fixée dans $\left[0\ ;1 \right]$, l’intervalle aléatoire $\left[F_n - \dfrac{1}{\sqrt{n}}\ ;F_n + \dfrac{1}{\sqrt{n}} \right]$ contient, pour $n$ assez grand, la proportion $p$ avec une probabilité supérieure ou égale à $0,95$.

Définition : intervalle de confiance

Soit $p$ la proportion inconnue d’un caractère dans une population.

On réalise l’expérience aléatoire de $n$ tirages au hasard, et on appelle $f$ la fréquence observée d’apparition du caractère.

L’intervalle $\left[f - \dfrac{1}{\sqrt{n}};f + \dfrac{1}{\sqrt{n}} \right]$ est appelé intervalle de confiance de la proportion inconnue $p$ au niveau de confiance $0,95$.

Théorème :

Un intervalle de confiance au niveau 95 % est d’amplitude $\dfrac{2}{\sqrt{n}}$ donc, plus la taille de l’échantillon est grande, plus l’intervalle de confiance obtenu est précis.

Si l’on souhaite situer $p$ dans un intervalle de longueur donnée $a$, alors on doit avoir $\dfrac{2}{\sqrt{n}} \leq a$ ce qui équivaut à $n \geq \dfrac{4}{a^2}$.

Propriété :

Un intervalle centré en $p$ fournit $p$ à la précision $x$ si son amplitude est $2x$.