Introduction
Nous citons dans cette introduction une note de Paul-Louis HENNEQUIN parue dans le bulletin vert n°436 de Novembre-Décembre 2001 (p.732-733), suite à l'article de Louis-Marie BONNEVAL intitulé "Intervalles : de confiance ?" et référencé ci-dessous.
Nous invitons vivement le lecteur à prendre connaissance de ce texte de L. M. Bonneval, avant de poursuivre la lecture du présent article.
Dans le bulletin vert n°427 (mars-avril 2000), pages 141-170, Louis-Marie BONNEVAL s'intéresse à l'intervalle de confiance pour l'estimation de la probabilité p inconnue d'un événement aléatoire à partir de la réalisation de n expériences indépendantes dans lesquelles l'événement est apparu avec une fréquence f.
Il propose les deux conjectures suivantes :
1)- Pour tout naturel n > 0, et pour tout réel p de [0,1] :
![[Graphics:Images/maillard2_gr_1.gif]](images/maillard2_gr_1.gif)
résultat facile à mémoriser pour un élève débutant en statistique inférentielle.
2)- Pour tout naturel n > 20, et pour tout réel p de [0,1] :
![[Graphics:Images/maillard2_gr_2.gif]](images/maillard2_gr_2.gif)
et suggère de travailler sur le niveau 0.93.
Daniel SAADA (Saada@club-internet.fr) nous a adressé le 17 Février 2001 une étude relative au cas particulier p = 0.5 et
, k naturel. Il obtient alors :
![[Graphics:Images/maillard2_gr_4.gif]](images/maillard2_gr_4.gif)
Par ailleur, il montre, toujours dans le cas particulier p = 0.5 que, pour n > 5 :
![[Graphics:Images/maillard2_gr_5.gif]](images/maillard2_gr_5.gif)
De son côté, Christian MAILLARD nous a adressé le 6 Août 2001 la démonstration des inégalités ci-dessous qui incluent les conjectures de L. M. Bonneval :
Pour tout p réel de [0,1] et pour tout naturel n supérieur à 552,
![[Graphics:Images/maillard2_gr_6.gif]](images/maillard2_gr_6.gif)
Pour tout p réel de [0,1] et pour tout naturel n supérieur à 56,
![[Graphics:Images/maillard2_gr_7.gif]](images/maillard2_gr_7.gif)
Pour tout p réel de [0,1] et pour tout naturel n supérieur à 20,
![[Graphics:Images/maillard2_gr_8.gif]](images/maillard2_gr_8.gif)
Et enfin pour tout p réel de [0,1] et pour tout naturel n non nul,
![[Graphics:Images/maillard2_gr_9.gif]](images/maillard2_gr_9.gif)
Cette démonstration s'accompagne d'une analyse très précise de l'approximation de la loi binomiale par la loi de Laplace-Gauss.
La démonstration de la conjecture Bonneval s'appuie sur le principe (mais s'appuie seulement) du calcul de l'erreur commise en remplaçant la loi binomiale par la loi normale.
La partie qui suit donne un calcul général de l'erreur entre les deux lois (une majoration de l'erreur, bien entendu).
Pour aboutir ensuite à la conjecture Bonneval, il faudra choisir
mais aussi faire un calcul spécifique de l'erreur dans ce cas précis (qui ne sera pas développé ici).
Calcul de l'erreur sur
où b est un réel positif quelconque
Sn suit une loi binomiale de paramètres n et p, et on pose :
.
Il est impossible de développer complètement les calculs menant à cet encadrement de l'erreur.
Je voudrais indiquer l'idée de départ et donner les résultats que j'ai trouvés.
Préalable : les conditions sur n et p sont les suivantes :
.
On utilise alors l'encadrement suivant de n! (c.f. par exemple "Méthodes Stochastiques" de ZieZold-KriKenberg)
![[Graphics:Images/maillard2_gr_15.gif]](images/maillard2_gr_15.gif)
Dans ce cas :
![[Graphics:Images/formule_1.gif]](images/formule_1.gif)
qui donne, après une étude de la dernière exponentielle :
![[Graphics:Images/formule_2.gif]](images/formule_2.gif)
Cette écriture n'étant valable que si
(1) et
(2).
Les conditions (1) et (2) sont vérifiées.
Je vais utiliser la méthode du point médian. On a :
![[Graphics:Images/formule_4.gif]](images/formule_4.gif)
On a alors
où K est un majorant de
et
. K dépend de n, p et b.
On fait alors varier k et pour cela je suis amené à distinguer deux cas : le cas où
est un entier, et le cas où c'en est pas un.
Je pose alors
et
si
n'est pas entier, sinon
.
Dans les deux cas, il est facile de voir que
et
.
On obtient alors
avec
et
.
On développe K(p,v) sous la forme :
où X dépend de n, v, p, q.
Alors
(car
est inférieur à 1), et on obtient de même une majoration similaire
.
Les conditions que j'ai imposées au départ sur n, p, q et b permettent d'encadrer les termes X et K et alors de calculer l'erreur commise en remplaçant la loi binomiale par la loi normale.
Voici mes résultats :
![[Graphics:Images/formule_6.gif]](images/formule_6.gif)
Exemple : p=0,03 ; n=4000 ; np=120 ; npq=116,4 ;
.
On a :
![[Graphics:Images/maillard2_gr_40.gif]](images/maillard2_gr_40.gif)
le calcul donne une erreur inférieure à 0,02902 et donc une valeur de A comprise entre 0,6751 et 0,61699.
La valeur réelle est d'environ 0,66969. Par conséquent l'approximation est relativement précise compte tenu du caractère un peu "limite" car la valeur minimale d'utilisation est npq supérieur à 116, et ici on a 116,4.
Converted by Mathematica
June 16, 2003