Este documento discute criterios para rechazar resultados erróneos en un conjunto de datos. Explica que no hay reglas uniformes para decidir si un resultado discrepante se debe a error o variación aleatoria. Recomienda rechazar un resultado solo si se identifica un error específico. También presenta la prueba Q para evaluar la validez de resultados discrepantes estadísticamente, y sugiere reportar la mediana en lugar de la media para conjuntos pequeños de datos donde no se puede rechazar un valor discrepante.
Voladura Controlada Sobrexcavación (como se lleva a cabo una voladura)
Rechazo de resultados inusuales
1. RECHAZODE UN RESULTADO
Con frecuencia,al efectuarunaserie de réplicasde unanálisis,unode losresultadosobtenidos
será muy distinto de los otros. Habrá que decidir se debe rechazarse o tenerse en cuenta.
Desafortunadamente,noexistencriteriosuniformesque puedan emplearse para decidir si un
resultado sospechoso pueda atribuirse a un error accidental o a variación aleatoria. La única
base confiable escuandopuede decidirseque se hacometidoalgúnerrorespecíficoal obtener
dato dudoso. El resultado no debe conservarse cuando se sabe que se ha cometido un error
para obtenerlo.
Número de
observaciones
Q
3 0.94
4 0.76
5 0.64
6 0.56
7 0.51
8 0.47
9 0.44
10 0.41
∞ 0.00
La experiencia y el sentido común pueden servir también como base práctica para juzgar la
validez de una observación particular, como una prueba estadística.
La pruebade laQ esuna de las máscorrectas desde el puntode vistaestadísticoparanúmeros
pequeñosde observacionesyse recomiendacuandoesnecesarioefectuarunacomprobación.
La relación Q se calcula ordenando los datos en orden decreciente de valor. La diferencia
entre el número sospechoso y su vecino más cercano se divide por el ámbito, es decir, la
diferencia entre el número mayor y el número menor.
𝑄 =
𝑎
𝑤
a
a
w
Ilustraciónde lamanerade calcularQ
2. Ejemplo1.Se reportaronlossiguientesconjuntosde análisis de cloruros en alícuotas tomadas
por separado de un suero. Aparentemente uno de los valores es erróneo. Determínese si
puede atribuirse esto a algún error accidental. 103, 106, 107, 114 meq/L.
Solución
El resultadosospechosoes114. Difiere de su vecino más cercano, 107, por 7 meq/L. Él ámbito
es 114-103 o sea 11 meq/L.
𝑄 =
𝑎
𝑤
=
7
11
= 0.64
Comparándolo con el valor tabulado para cuatro observaciones es 0.76. como el valor
calculado para Q es menor que el valor tabulado para Q, no debe rechazarse el resultado
sospechoso.
Cuando se efectúan pocas mediciones (por ejemplo de tres a cinco) la discrepancia de
mediciones debe ser bastante grande para que pueda rechazarse alguna de ellas según este
criterio, y es probable que se incluyan resultados erróneos. Esto provocaría un cambio
significativo de la media aritmética, porque la media está muy influenciada por los valores
discordantes. Por este motivo se ha sugerido que la mediana se reporte en vez de la media
cuandono puedarechazarse unnúmerodiscordante porhaberse efectuadopocasmediciones.
La medianapresentaventajade no estar muy influenciada por los valores discrepantes. En el
ejemplo anterior, la mediana sería el promedio de los dos valores centrales
𝑚𝑒𝑑𝑖𝑎𝑛𝑎 =
106+107
2
= 106
Esto se compara con una media de
𝑚𝑒𝑑𝑖𝑎 ( 𝑥̅) =
103 + 106 + 107 + 114
4
= 108
Se sugiere el siguiente procedimientoque puede serrazonable esperarse para el método para
decidir si un número en particular es en realidad dudoso.
1. Estimarla precisiónque puede serrazonableesperarse parael métodoparadecirsi un
número en particular es en realidad dudoso.
2. Comprobar los datos que permitieron obtener dicho número para observar si puede
identificarse algún error definido.
3. De ser posible efectúese otro análisis. Si el nuevo resultado concuerda con los datos
previamente obtenidos, probablemente deba rechazarse el resultado sospechoso.
4. Cuando no puedan obtenerse nuevos datos, hágase la prueba de la Q.
5. Si la prueba de la Q indica que debe conservarse un número sospechoso, reportar la
mediana en vez de la media cuando el conjunto de datos sea pequeño.