Tratamiento Estadístico de Datos
En la Química Analítica Experimental,
específicamente en el Análisis Cuantitativo,
los datos que se obtienen son para generar
información de:
1. Peso
2. Densidad
3. Absorción
4. Volumen
5. Conductividad eléctrica
Tratamiento Estadístico de Datos
Media aritmética es el número obtenido al
dividir la suma de todos los valores de la
variable entre el número total de
observaciones, y se define por la siguiente
expresión:
Media Aritmética
Valor observado
Total de mediciones
Tratamiento Estadístico de Datos
Mediana: Es el valor alrededor del cual los
demás se distribuyen simétricamente, se
representa por “m”.
Los valores observados (X) se acomodan en
orden creciente o decreciente.
Si la cantidad de términos es impar, la
mediana es el valor central.
Si la cantidad de términos es par, suma los
dos términos del medio y divide por 2.
Tratamiento Estadístico de Datos
Ejercicio:
Calcule la media y mediana de: 5.06, 5.20, 5.08,
5.10
Media = 5.11
Mediana = 5.09
Tratamiento Estadístico de Datos
Intervalo: Es la diferencia entre el valor
observado o medido más alto y más bajo, se
representa por R
Calcule el rango para la serie de datos anteriores.
5.06, 5.20, 5.08, 5.10
Intervalo = 5.20 -5.06 = 0.14
Tratamiento Estadístico de Datos
Desviación: Es la diferencia entre un valor y la
media aritmética expresada como valor
absoluto.
Desviación Promedio : Es el valor promedio
de las desviaciones.
Tratamiento Estadístico de Datos
Desviación Estándar: Es la distancia de la
media a cualquier punto de inflexión de la curva
de distribución. Nos dá una medida de que tan
dispersos están los valores que componen la
población.
Para un número finito de valores la desviación
estándar se designa por “s”:
Tratamiento Estadístico de Datos
Desviación Estándar
Para un número infinito de valores, la desviación
estándar se designa por “s” (Valores de n
mayores a 50).
Tratamiento Estadístico de Datos
Desviación Estándar:
Análisis del % de cloruros en una muestra de agua
potable arrojó los siguientes datos.
Muestra % Cloruros
1 24.39
2 24.20
3 24.28
Calcular la media, la
desviación, la desviación
promedio y estándar
Media = 24.29 d = 0.1, 0.09, 0.01
d prom = 0.0666 s = 0.095
El resultado se expresa como : 24.29 +- 0.095 % de Cl-
Tratamiento Estadístico de Datos
Desviación Estándar:
Se analizó una muestra de cal viva para determinar el
contenido % de CaO. Los resultados se muestras a
continuación:
Calcular la media, la
desviación, la desviación
promedio y estándar
Media = 56.06 d = 0.11, 0.06, 0.02,
0.02, 0.17 d prom = 0.076 s = 0.10673
El resultado se expresa como : 56.06 +- 0.10673 % de CaO
Análisis % CaO
1 55.95
2 56.00
3 56.04
4 56.08
5 56.23
Tratamiento Estadístico de Datos
Desviación Estándar:
Se analizó una muestra de mineral que contiene Au.
Los resultados se recogen en la siguiente tabla.
Calcular la media, la
desviación, la desviación
promedio y estándar
Media =
d =
d prom =
s =
El resultado se expresa como :
Análisis g Au/
Ton
1 1.32
2 1.54
3 2.10
4 1.87
5 1.45
Tratamiento Estadístico de Datos
Supongamos que se han hecho las siguientes 4
medidas: 821, 783, 834 y 855. Hallar la media y la
desviación estándar
X =823.2 y s=30.3
Tratamiento Estadístico de Datos
Exactitud y Precisión
Exactitud: Es la concordancia de las medidas
con el valor verdadero de la cantidad medida.
Que tan cerca estamos del valor verdadero.
Precisión: Expresa la reproducibilidad de una
medida. La reproducibilidad de una medida es
expresada por:
• Desviación Absoluta o Relativa
• Desviación Promedio
• Desviación Estándar
Tratamiento Estadístico de Datos
Exactitud y Precisión
Precisión + Exactitud = Veracidad o Confiabilidad del
Resultados
Tratamiento Estadístico de Datos
Exactitud y Precisión
Se les pide a 3 estudiantes (A, B y C) que pesen 2
veces una muestra de 2 gr., los resultados fueron los
siguientes:
A 1.964 1.978
B 1.972 1.968
C 2.000 2.002
¿Quién fue más preciso?
¿Cómo es B con respecto a A?
¿Cómo es C con respecto a A y B?
1.-Determino la Media
2.-Determino la Desviación
C
Más preciso
Más preciso
Criterio para Descartar una Observación
Como regla general una medición se rechaza en
forma automática cuando se sabe que se ha
cometido un error.
Problema General:
Como decidir descartar un resultado que parece
discordante cuando no se conoce ninguna razón
para desconfiar de él?
Criterio para Descartar una Observación
Solución al Problema General:
-Definir que tan grande debe ser la diferencia
entre el valor sospechoso y los otros datos
antes de que el resultado sea descartado.
-Aplicar una prueba estadística para descartar
errores.
Criterio para Descartar una Observación
Cuando se descartan datos generalmente se
incurre en dos tipos de errores, estos son:
Error de Primera Clase: Si la diferencia se elije
muy pequeña, los datos válidos se pueden
rechazar con mucha frecuencia.
Error de Segunda Clase: Si la diferencia se elije
muy alta, lleva a conservar valores altamente
erróneos
Las diversas recomendaciones para el criterio de
desechar algún dato nos lleva a cometer errores de
extremos opuestos.
Calcular la media y la desviación promedio de los
resultados “buenos”.
Encontrar la desviación del resultado sospechoso a partir
de la media de los resultados “Buenos”.
Si la desviación del resultado sospechoso es por lo
menos 2.5 veces la desviación promedio de los
resultados “buenos”, descartar el resultado
sospechosos, si no hay que conservarlo.
(2.5)(d) d entonces “Descartar el dato”
(2.5)(d) d entonces “no descartar el dato”
Regla 2.5d
Pruebas Estadísticas para Descartar Errores.
Esta regla generalmente se aplica a poblaciones
grandes y se extiende a muestras pequeñas sin la
compensación adecuada.
La aplicación de esta regla genera Errores de
Primera Clase.
Regla 2.5d
Pruebas Estadísticas para Descartar Errores.
Un estudiante obtuvo los siguientes resultados para
el % de Fe en un material:
Regla 2.5d
Análisis % Fe
1 15.44
2 15.02
3 15.60
4 15.42
5 15.80
Valor dudoso = 15.02
Determinar.
1.- Media
2.- Desviación
3.- Desviación promedio
Empleando la Regla 2.5d diga el si valor dudoso se
descarta o no.
Regla 4d
1. Calcular la media y la desviación promedio de los
resultados “buenos”.
2. Encontrar la desviación del resultado sospechoso a
partir de la media de los resultados “buenos”.
3. Si la desviación del resultado sospechoso es por
lo menos 4 veces la desviación promedio de los
resultados “buenos”, descartar el resultado
sospechoso. Si no es así, conservarlo.
(4)(d) d Descartar el dato
(4)(d) d No descartar el dato
Prueba-Q
Prueba estadística para descartar un resultado
experimental con una probabilidad o confianza
determinada.
Esta prueba permite descartar un resultado con una
confianza del 90% asegurando que el resultado
sospechoso estuvo sujeto a algún error especial.
Con esta prueba, los errores de Primera Clase son
muy improbables.
Cuando se aplica a grupo de 3 a 5 resultados, permite
descartar sólo los resultados que se desvían mucho y
lleva a errores de Segunda Clase.
Prueba-Q
La Prueba-Q provee una justificación excelente para
descartar valores muy erróneos, pero no elimina el
dilema al tratar con valores sospechosos pero menos
desviados.
Prueba-Q
Procedimiento para aplicar la Prueba-Q
1. Calcular el rango o intervalo de los resultados R.
2. Encontrar la diferencia entre el resultado
sospechoso y su vecino más cercano.
3. Dividir la diferencia obtenida en el Paso 2 entre el
rango del Paso 1, para obtener el coeficiente de
descartación Q.
Prueba-Q
Procedimiento para aplicar la Prueba-Q
4. Consultar una tabla de valores “Q”.
Tabla 1. Valores del Coeficiente de descartación Q
No. de
Observaciones
Q0.90
3 0.94
4 0.76
5 0.64
6 0.56
7 0.51
8 0.47
9 0.44
10 0.41
No. de
Observaciones
Q0.95
4 0.831
5 0.717
6 0.621
7 0.570
8 0.524
9 0.492
10 0.464
Prueba-Q
Procedimiento para aplicar la Prueba-Q
Si el valor calculado Q es mayor que el de la tabla, el
resultado se puede descartar con un 90% de
confianza de que en realidad estuvo sujeto a algún
valor que no actuó sobre los otros resultados.
QT > QC
El dato se conserva
donde:
QT = Q teórica
QC = Q calculada
Prueba-Q
Ejemplo:
Cuatro resultados obtenidos para determinar la
normalidad de una solución fueron 0.1014. 0.1012,
0.1019 y 0.1016. Puede descartarse el valor de 0.1019?
Solución:
a) Calcule la media (x) y la d de los resultados “buenos”
Resultados d
0.1014 0.0000
0.1012 0.0002
0.1016 0.0002
x : 0.1014 d : 0.00013
Prueba-Q
b) Calcule la desviación del resultado sospechoso a partir de
la media de los resultados “buenos”
0.1019 - 0.1014 = 0.0005 = 5 x 10-4
Aplicando la Regla 2.5d:
(2.5)(1.3 x 10-4) = 3.3 x 10-4
3.3 x 10-4 5 x 10-4
El resultado se descarta
Aplicando la Regla 4d:
(4)(1.3 x 10-4) = 5.2 x 10-4
5.2 x 10-4 5 x 10-4
El resultado no se descarta
Prueba-Q
Aplicando la Prueba-Q:
Q = 0.1019 - 0.1016
0.1019 - 0.1012
Q = 0.0003 = 0.43
0.0007
Según la Tabla 1, Q0.90 para 4 observaciones es 0.76
0.43 0.76 El dato no se descarta