Je viens de publier un billet sur mon blog qui traite de l'estimation d'un intervalle de confiance pour un écart-type (Suivre http://www.lametrologieautrement.com). Cela m'a rappelé une ancienne conférence, présentée en 2003 dans le cadre d'un congrès international de Métrologie. J'ai relu avec beaucoup de tolérance ce travail "d'il y a 10 ans", mais que de progrès réalisés depuis ...
2. QUELLE FORMULE CHOISIR ?
Cet exposé a 2 objectifs :
1. Répondre à la question initiale concernant la
façon de calculer un écart type expérimental à
partir d’un échantillon de valeurs.
2. Montrer les perspectives que présentent
l’utilisation de la simulation numérique.
3. QUELLE FORMULE CHOISIR ?
Dans le cas des évaluations d’incertitudes dites
de « type A », la qualité de l’estimateur d’écarttype dépend du nombre d’échantillons (de
mesures) utilisés.
La littérature présente différentes approches dans
le cas des faibles échantillonnages. Certaines
méthodes proposent de multiplier l’écart type
calculé suivant la formule générale par un
correcteur, d’autres de diviser l’étendue du
prélèvement par un scalaire.
4. QUELLE FORMULE CHOISIR ?
La norme NF X 06-072 travaille en appliquant
un correcteur à l’écart type théorique. Les
coefficients, qui dépendent du nombre
d’échantillons, sont les suivants :
Nb d ’échantillons
2
3
4
5
6
7
1,254
1,128
1,085
1,063
1,05
1,043
8
9
10
11
12
13
14
1,036
1,031
1,028
1,025
1,023
1,02
1,02
Correcteur
5. QUELLE FORMULE CHOISIR ?
La norme NF ENV ISO 14253-2 travaille elle aussi en
appliquant un correcteur à l’écart type théorique. Les
coefficients, différents des précédents, dépendent
également du nombre d’échantillons :
Nb d’échantillons
2
3
4
5
6
7
8
9
Correcteur
7
2,3
1,7
1,4
1,3
1,3
1,2
1,2
6. QUELLE FORMULE CHOISIR ?
La norme FD X 07-021 propose de diviser l’étendue d’un
prélèvement par un scalaire, lui aussi en fonction du
nombre d’échantillons prélevés :
Nb d’échantillons
2
3
4
5
6
1,128
1,693
2,059
2,326
2,534
7
8
9
10
11
12
2,704
2,847
2,97
3,078
3,173
3,258
Diviseur
7. QUELLE FORMULE CHOISIR ?
Le M.S.A (Measurement System Analysis) propose
également de diviser l’étendue d’un prélèvement par un
scalaire, fonction évidemment du nombre d’échantillons
prélevés :
Nb d’échantillons
Diviseur
2
1,41421
6
7
2,67253
3
1,91155
8
4
2,23887
9
5
2,48124
10
16
3,61071
3,07794
3,17905
13
14
15
3,35016
3,42378
3,49116
3,55333
17
3,26909
2,96288
12
11
2,82981
18
19
20
3,66422
3,71424
3,76118
3,80537
8. QUELLE FORMULE CHOISIR ?
Chaque méthode propose des solutions différentes qui conduisent,
évidemment, à des estimateurs différents. La simulation numérique
permet de définir l’approche la plus cohérente.
La méthode proposée s’appuie sur la simulation numérique. A partir
d’une population importante déterminée (plus de 100 000 éléments),
on réalise des prélèvements, de 2 à 50 éléments, puis on compare
l’écart type du prélèvement à l’écart type théorique déterminé à partir
de toute la population. On recherche également la relation entre
l’étendue du prélèvement et l’écart type de la distribution totale.
Afin d’évaluer l’incertitude sur l’écart type, on prélève n fois 2
éléments, n fois 3 éléments, …, n fois 50 éléments puis on calcule
l’écart type moyen et l’écart type de l’écart type pour chaque type de
prélèvements (2, 3, … 50 éléments) et pour chaque formule. On fait
de même concernant l’approche par rapport à l’étendue.
9. QUELLE FORMULE CHOISIR ?
La pertinence des résultats obtenus est directement liée à
la qualité du simulateur numérique utilisé. Quatre lois
sont utilisées (Uniforme, normale, dérivée d’arc sinus et
triangle isocèle). Le simulateur utilisé donne, pour 10 000
tirages, les résultats suivants :
Loi Uniforme
Loi Triangle isocèle
Loi Dérivée d'arc sinus
Loi normale
10. QUELLE FORMULE CHOISIR ?
La simulation numérique montre que toutes les
approches proposées donnent des résultats
différents, la plus éloignées de la réalité étant
l’approche suivant la norme NF ENV ISO 14 2532 (Cf actes du congrès 2003).
La simulation numérique permet de redéfinir des
coefficients et de leur associer une incertitude.
11. La correction de l’écart-type expérimental est-elle
fonction de la valeur de l’écart type ?
En réalisant n (500) prélèvements dans des distributions d’écart
types théoriques variant de 0,01 à 100, il est possible de vérifier si
l’écart type expérimental est influencé par l’écart type théorique :
Toutes lois confondues - 3 échantillons
Toutes lois confondues - 2 échantillons
1,6
1,2
y = 6E-05x + 1,2344
y = -7E-05x + 1,107
1,15
1,4
1,1
1,2
1,05
1
1
0
20
40
60
80
100
0
120
20
40
60
80
100
120
Toutes lois confondues - 5 mesures
Toutes lois confondus - 4 échantillons
1,12
1,16
1,14
1,12
1,1
1,08
y = 9E-05x + 1,0642
y = 6E-06x + 1,0469
1,1
1,08
1,06
1,06
1,04
1,04
1,02
1,02
1
1
0
20
40
60
80
100
120
0
20
40
60
80
100
Les graphes ci-dessus montrent que la correction n’est pas
fonction de la valeur de l’écart type lui-même
120
12. La correction de l’écart-type expérimental est-elle
fonction de la loi de distribution initiale ?
L’analyse du rapport entre l’écart type expérimental et l’écart type
théorique d’une part, l’étendue du prélèvement et l’écart type
théorique d’autre part, en fonction du nombre d’échantillons
montre :
E
cart ty pe théorique / Ecart type expérim
ental
E
tendue du prélèvem
ent / E
cart type théorique
1,3
5
Dérivée d'arc sinus
Norm
ale
1,25
4,5
Unif orm
e
Triangle
4
1,2
3,5
1,15
3
1,1
2,5
1,05
2
Dérivée d'arcsinus
1,5
1
Normale
1
Unif orm
e
0,95
Triangle
0,5
0,9
0
10
20
30
40
50
60
0
0
1
0
20
30
40
50
60
Le rapport n’est pas indépendant de la loi initiale, dans les deux cas ! Néanmoins,
et puisqu’il n’est pas possible, au préalable, de connaître la loi de distribution
initiale dans le cas d’une expérimentation, la moyenne des résultats obtenus, pour
toutes les lois initiales, sera retenue.
13. Dispersion des coefficients ?
Chaque simulation réalisée conduit à une rapport entre écart type expérimental
et écart type théorique d’une part, étendue et écart type théorique d’autre part. n
simulations donnent n rapports … on s’attachera à observer le rapport et l’écart
type sur le rapport, écart type résultant des n simulations :
Rapport et incertitude sur le rapport (en fonction de l'écart type)
Rapport et incertitude sur le rapport (en fonction de l'étendue)
1,3500
0,0450
Coef f icient sur écart type
1,3000
6,0000
0,700
0,0400
ÉcartTypeDeNouveau Coef f
1,2500
0,0350
1,2000
0,0300
1,1500
0,600
5,0000
0,0250
0,500
4,0000
0,400
3,0000
1,1000
0,0200
1,0500
0,0150
1,0000
0,0100
0,9500
0,0050
0,300
2,0000
0,200
1,0000
0,9000
0,0000
0
10
20
30
40
50
60
0,100
Coeff sur étendue
ÉcartTypeDeNouveau Coeff Etendue
0,0000
0,000
0
10
20
30
40
50
60
La simulation numérique montre que l’incertitude sur le rapport est nettement plus
grande lorsqu’on travaille sur les étendues plutôt que sur les écart types. Pour les faibles
échantillonnages, l’incertitude semble néanmoins plus petite !
14. Incertitude globale sur les écart-types
corrigés
Lorsqu’on travaille sur les écart types, la formule s’écrit : sCor = Sexp x Coeff.
L’incertitude sur scor, par application de la loi de propagation, s’écrit :
u² sCor = (dsCor/dsexp) x u²sexp + (dsCor/dCoeff) x u²Coeff
Lorsqu’on travaille sur les étendues, la formule s’écrit : sCor = Etendue / Coeff.
L’incertitude sur scor, par application de la loi de propagation, s’écrit :
u² sCor = (dsCor/dEtendue) x u²Etendue + (dsCor/dCoeff) x u²Coeff
L’applicatrion numérique montre, en fonction du nombre d’échantillons :
A partir de l'éc art type ex périmental
En f onction de l'étendue
160,00%
250,00%
Incertitude %
(2 mesures)
140,00%
Inc ertitude %
(2 mes ures )
Inc ertitude %
(3 mes ures )
120,00%
Incertitude %
(3 mesures)
200,00%
Incertitude %
(4 mesures)
Inc ertitude %
(4 mes ures )
Inc ertitude %
(5 mes ures )
100,00%
Incertitude %
(5 mesures)
150,00%
Incertitude %
(10 mesures)
Inc ertitude %
(10 mesures)
80,00%
Inc ertitude %
(15 mesures)
Inc ertitude %
(20 mesures)
60,00%
Incertitude %
(15 mesures)
Incertitude %
(20 mesures)
100,00%
Inc ertitude %
(30 mesures)
Incertitude %
(30 mesures)
Inc ertitude %
(40 mesures)
40,00%
Inc ertitude %
(50 mesures)
Incertitude %
(40 mesures)
50,00%
Incertitude %
(50 mesures)
20,00%
0,00%
0,00%
0
20
40
60
80
100
120
0
20
40
60
80
100
120
L’incertitude globale sur l’écart type corrigé, calculée à partir des résultats obtenus par
simulation numérique ( usexp, uCoeff et uEtendue) montre que l’approche à partir de l’étendue conduit
à une incertitude sur l’écart type corrigé nettement supérieure à celle obtenue à partir de l’écart
type expérimental
15. Distribution des écart-types expérimentaux
La distribution des écart-types expérimentaux, en fonction du
nombre d’échantillons et de la loi initiale, prend les allures
suivantes :
Loi initale normale - 2 échantillons
Loi initiale normale - 3 échantillons
Loi initale normale - 4 échantillons
Loi initiale Dérivée d'Arc Sinus - 2 échantillons
Loi initiale Dérivée d'Arc Sinus - 3 échantillons
Loi initiale Dérivée d'Arc Sinus - 4 échantillons
Loi initiale Dérivée d'Arc Sinus - 5 échantillons
Loi initiale Uniforme - 2 échantillons
Loi initiale unif orme - 3 échantillons
Loi initiale Uniforme - 4 échantillons
Loi initiale Uniforme - 5 échantillons
Loi initiale normale - 5 échantillons
Tout écart-type, évalué sur la base d’un prélèvement inférieur à 5
échantillons, n’a pas de niveau de confiance appréciable !