El documento trata sobre la importancia de la estadística y la quimiometría en la química analítica. Explica que durante un análisis cuantitativo es importante considerar las variables que pueden afectar los resultados, como errores en los instrumentos o por el operador. También describe conceptos básicos de estadística como media, mediana, moda, varianza y desviación estándar.
El presente informe busca:
Conocer las técnicas básicas para la preparación de soluciones de distintas concentraciones físicas y químicas.
Valorar una solución ácida y determinar su concentración.
Valorar una solución básica y determinar su concentración.
Cuando las moléculas de una especie química, interactúan con la energía radiante de la región visible y ultravioleta, se puede llevar a cabo una absorción, que proporciona al electrón la energía necesaria para saltar al siguiente nivel energético del átomo. Se ha comprobado que el espectro de absorción es una función de la estructura completa de una sustancia; por ello es una propiedad altamente específica de la estructura molecular de la especie absorbente. Existen factores que influyen en los espectros obtenidos, por ejemplo: el solvente, pH, temperatura, etc., que se deben de tomar en cuenta en una determinación cuidadosa.
El presente informe busca:
Conocer las técnicas básicas para la preparación de soluciones de distintas concentraciones físicas y químicas.
Valorar una solución ácida y determinar su concentración.
Valorar una solución básica y determinar su concentración.
Cuando las moléculas de una especie química, interactúan con la energía radiante de la región visible y ultravioleta, se puede llevar a cabo una absorción, que proporciona al electrón la energía necesaria para saltar al siguiente nivel energético del átomo. Se ha comprobado que el espectro de absorción es una función de la estructura completa de una sustancia; por ello es una propiedad altamente específica de la estructura molecular de la especie absorbente. Existen factores que influyen en los espectros obtenidos, por ejemplo: el solvente, pH, temperatura, etc., que se deben de tomar en cuenta en una determinación cuidadosa.
Medidas de dispersión: Concepto. Características y usos. Rango. Desviaciones típicas. Varianza y coeficiente de variación. De c/u Concepto, Características y utilidad
El análisis exploratorio de datos es una forma de analizar datos definido por John W. Tukey (E.D.A.: Exploratory data analysis) es el tratamiento estadístico al que se someten las muestras recogidas durante un proceso de investigación en cualquier campo científico
Las capacidades sociomotrices son las que hacen posible que el individuo se pueda desenvolver socialmente de acuerdo a la actuación motriz propias de cada edad evolutiva del individuo; Martha Castañer las clasifica en: Interacción y comunicación, introyección, emoción y expresión, creatividad e imaginación.
Instrucciones del procedimiento para la oferta y la gestión conjunta del proceso de admisión a los centros públicos de primer ciclo de educación infantil de Pamplona para el curso 2024-2025.
2. IMPORTANCIA DE LA ESTADÍSTICA Y
LA QUIMIOMETRÍA EN LA QUÍMICA ANALÍTICA
Durante la realización de una análisis
cuantitativo es muy importante tomar en cuenta
todas las variables que pueden afectar nuestro
resultado, dentro de estos están los factores
provocados por los instrumentos utilizados y los
errores provocados por quien maneja el
material.
En el reporte de cualquier análisis químico,
es importante tomar en cuenta este tipo de
errores , hacer un análisis de los resultados
y así se podrá concluir sobre él.
3. ¿ Qué es estadística?
La estadística es una colección de métodos para
planificar y realizar experimentos, obtener datos y
luego analizar, interpretar, y formular una conclusión
basada en esos datos. Es la ciencia encargada de
recopilar, organizar, analizar e interpretar información
numérica o cualitativa, de manera que pueda llevar a
conclusiones válidas.
4.
5. Unidad 1: Estadística Descriptiva.
Arturo A. Alvarado S. (ITSY 2006)
La Estadística se utiliza como tecnología al
servicio de las ciencias donde la variabilidad y la
incertidumbre forman parte de su naturaleza.
La Estadística es la Ciencia de la
Sistematización, recolección, ordenación y
presentación de los datos referentes a un fenómeno que
presenta variabilidad o incertidumbre para su estudio
metódico, con objeto de
deducir las leyes que rigen esos fenómenos,
y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener conclusiones.
Descriptiva
Probabilidad
Inferencia
6. Unidad 1: Estadística Descriptiva. Arturo A.
Alvarado S. (ITSY 2006)
6
DATOS NO AGRUPADOS
• Medidas de
tendencia central
Media aritmética
Mediana
Moda
Percentiles
(posición)
Rango (amplitud)
Rango
intercuartílico
Varianza
Coef. de variación
Medidas de
dispersión
7.
8. • Mediana
– En una serie de datos ordenados (creciente o
decreciente) es la puntuación o valor central de
la distribución estadística
• Datos no agrupados
– Si el nº de datos es impar: valor central
– Si el nº de datos es par: media aritmética de los 2 puntos
centrales
Medidas de tendencia central
9. • Mediana
– Características
• Menos sensible que la media a la variación de las
puntuaciones.
• Se puede calcular aunque algún intervalo carezca
de límite.
• Más representativa que la media cuando
puntuaciones muy extremas.
Medidas de tendencia central
10. Medidas de tendencia central
• Moda
– Valor de la variable que más veces se
repite en una serie estadística (máxima
frecuencia)
• Distribuciones: Unimodales o multimodales
• Marca de clase (en intervalos)
– Características:
• Sencilla de calcular
• Se puede calcular si algún intervalo no tiene límites
• Poco representativa
11. • Media
–Suma de todos los valores de una
variable dividida por el número
total de valores
–Sólo en variables cuantitativas
Medidas de tendencia central
• X = Σ xi / N
12. • Media. Cálculo
– Datos no agrupados: aplicar fórmula
– Datos agrupados
• En tabla de frecuencia: Suma de todos los valores
multiplicados por sus frecuencias y dividido por el
nº total.
X = Σ xi fi / N
Medidas de tendencia central
13. • Media
– Características
• La media es sensible a la variación de las
puntuaciones.
• No se puede calcular si algún intervalo es de límite
abierto.
• No es recomendable si valores muy extremos
Medidas de tendencia central
14. Medidas de dispersión
• Reflejan la dispersión, oscilación de
los datos, respecto al fenómeno
estudiado.
• Complementan las de tendencia
central para la descripción de una
distribución
15. Medidas de dispersión
• Amplitud o rango
– Diferencia entre el valor más alto y más bajo
de la distribución.
• Ofrece poca información sobre la agrupación de
los datos.
• Indica el “campo de variabilidad”.
• Suele acompañar a la moda.
16. Medidas de dispersión
• Varianza
– Junto a la desviación típica, la que mejor expresa
la variabilidad del fenómeno
– Media de los cuadrados de las diferencias entre
cada valor de la variable y la media aritmética
•S2
= Σ (xi – x)2
/ N
– Para datos agrupados:
•S2
= Σ fi(xi – x) 2
/ N
•S2
= Σ xi
2
/ N – x2
•S2
= Σ fixi
2
/ N – x2
17. Medidas de dispersión
• Desviación típica
– Es la raíz cuadrada de la varianza
– Para datos agrupados:
•S2
= Σ xi
2
/ N – x2
•S2
= Σ fixi
2
/ N –x2
18. Medidas de dispersión
• Varianza y desviación típica
– Características
• Ambas toman siempre valores positivos.
• Si todos los datos de una distribución son
iguales entre sí, toman el valor 0.
• Sólo son aplicables a variables cuantitativas
• La que más se suele usar es la desviación típica.
• Si los datos están muy dispersos, la desviación típica será
muy grande.
19. Medidas de dispersión
• Coeficiente de variación de Pearson
– Para poder comparar la dispersión entre 2
ó más variables entre sí, o una misma
variable en 2 ó más grupos estudiados
– Es una medida relativa: Relaciona la
media con la desviación típica
• CV = S / X * 100
25. DISTRIBUCIO DE FRECUENCIAS
• En una distribución de datos estos pueden estar o no
agrupados.
DATOS NO AGRUPADOS EN
INTERVALOS:
X =
n
i
⋅X
i∑
n
Xi ni
4 1
3 3
2 7
1 6
0 3
Xi ni Xi*ni
4 1 4
3 3 9
2 7 14
1 6 6
0 3 0
33
mitjana= 33/5= 6,6
DATOS AGRUPADOS EN INTERVALOS:
SUPUESTO DE CONCENTRACION EN
EL PUNTO MEDIO (Xi):
X =
n
i
⋅X
i
∑
n
Xi ni
18-20 20
15-17 30
12-14 60
9-11 40
6-8 30
3-5 20
Xi ni P. M. PM*ni
18 20 20 19 380
15 17 30 16 480
12 14 60 13 780
9 11 40 10 400
6 8 30 7 210
3 5 20 4 80
2330
mitjanna= 2330/200= 11,65
26. ¿CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA MEDIA?:
1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA
ORDINAL.
2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN
LA INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25
LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS
3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS
CARECEN DE PUNTO MEDIO.
27. LAS TRES MEDIDAS DE TENDENCIA CENTRAL COINCIDEN CUANDO
LA DISTRIBUCION ES UNIMODAL Y SIMETRICA (EJEMPLO:
DISTRIBUCION NORMAL).
CUANTO MAS ASIMETRIA, MAS DIFERENCIAS ENTRE ELLAS.
28. • Datos simétricos: coinciden la media, la
mediana y la moda
Media
Mediana
Moda
f(X)
X
La distribución normal
29. Propiedades de la distribución
normal:
El área bajo la curva aproximado del promedio μ a
más o menos una desviación estándar (1σ) es de
0.68, a más o menos 2σ es de .0 95 y a más o menos
3σ es de 0.99.
(Las propiedades continuan en la próxima lámina)
30. Propiedades de la distribución
normal:
La forma de la campana de Gauss depende de los parámetros
μ y σ.
Tiene una única moda que coincide con su media y su
mediana.
La curva normal es asintótica al eje de X.
Es simétrica con respecto a su media μ . Según esto, para este
tipo de variables existe una probabilidad de un 50% de observar
un dato mayor que la media, y un 50% de observar un dato
menor.
31. En resumen
• Podemos concluir que hay una familia de
distribuciones con una forma común, diferenciadas por
los valores de su media y su varianza.
• La desviación estándar (σ ) determina el grado de
apuntamiento de la curva. Cuanto mayor sea el valor
de σ, más se dispersarán los datos en torno a la media
y la curva será más plana.
• La media indica la posición de la campana, de modo
que para diferentes valores de μ la gráfica es
desplazada a lo largo del eje horizontal.
• De entre todas ellas, la más utilizada es la
distribución normal estándar, que corresponde a
una distribución de media 0 y varianza 1.
32. ERRORES EN LOS ANALISIS
QUIMICOS
• Es imposible efectuar análisis químicos
totalmente libres de errores o
incertidumbres.
• La fiabilidad de un resultado se analiza de
diferentes maneras
• Se analizan patrones de composición
conocida
• Se aplican pruebas estadísticas a los
datos
33. En ciencias e ingeniería, el concepto de error
tiene un significado diferente del uso habitual de
este término. Coloquialmente, es usual el
empleo del término error como análogo o
equivalente a equivocación.
En ciencia e ingeniería, el error, está más bien
asociado al concepto de INCERTEZA,
INCERTIDUMBRE, en la determinación del
resultado de una medición.
ERROR: es la medida del sesgo en el resultado de
una medición.
INCERTIDUMBRE: es el intervalo o rango de los valores
posibles de una medida. Incluye tanto los errores
sistemáticos como aleatorios.
La incertidumbre de un resultado es bien diferente de
la precisión, ésta da una medida del error aleatorio.
34.
35. Groseros o accidentales
Son errores que son tan
importantes que no existe alternativa
real que abandonar el experimento y
empezar de nuevo por completo.
Aleatorio
Estos provocan que
los resultados
individuales difieran uno
del otro de manera
que caigan a ambos lados
del valor medio.
Estos errores
afectan la precisión
de un experimento.
Este tipo de errores son
los que comete el operador
del instrumento utilizado.
Sistemáticos
Provocan que todos los
resultados
sean erróneos en el mismo
sentido, son demasiado
grandes, y se denomina también
sesgo de la medida. Este tipo
de error es
responsabilidad
del material empleado
y de su origen y presión
de fabricación.
Errores
36.
37. Errores experimentales
• Error absoluto.- Nos indica si medimos u obtuvimos
mas o menos que el valor experimental, y en qué cantidad
excedimos del valor real o qué cantidad nos faltó; esto
según el signo de la sustracción.
EA = valor experimental – valor teórico
• Error relativo.- Es una forma de conocer el porcentaje
de error que obtuvimos en nuestros resultados.
ER = (valor experimental – valor teórico) x 100
(valor teórico)
38. Los errores presentes en un estudio analítico modifican:
• Precisión
Es el grado de confianza con que se puede repetir un
experimento y este puede dar los mismo resultados. Es
utilizado como sinónimo de repetitibilidad.
• Exactitud
Es el grado de concordancia entre el resultado de un
ensayo y el valor de referencia aceptado.
39. TERMINOS IMPORTANTES
Media, Media aritmética y promedio (X) son
términos sinónimos. Es la medida de tendencia
central mas utilizada .Se obtiene dividiendo la
suma de los valores de una serie y dividiendo
por el numero de medidas del conjunto.
• Mediana es el resultado alrededor del cual se
reparten los demás por igual. Si la serie es un
numero impar la mediana es el numero de la
mitad. Si la serie es un numero par se toma el
promedio del par central después de haber
ordenado la serie de menor a mayor.
40. TERMINOS IMPORTANTES
• Ejemplo: calcular la media y la mediana
de 10.06, 10.20, 10.08, 10.10.
• Media = X =10.06+10.20+10.08+10.10 = 10.11
4
Mediana = 10.08 +10.10 = 10.09
2
41. CIFRAS SIGNIFICATIVAS
•Es el numero necesario de dígitos para
expresar los resultados de una
medición congruente con la precisión
de medida.
237 : 2 centenas, 3 decenas y
7 unidades
• El numero de cifras significativas
incluye todos los dígitos que se
conocen mas el primer digito incierto.
42. El numero de cifras
significativas en una medición
es independiente de la
colocación del punto decimal.
Por ejemplo el numero 92.067: Este numero
tiene cinco cifras significativas independiente
donde se coloque el punto decimal. En este
caso el cero si es una cifra significativa.
En el numero 727.0 el cero no se usa para
localizar el punto decimal es significativo
Por ejemplo el numero 92.067: Este numero
tiene cinco cifras significativas independiente
donde se coloque el punto decimal. En este
caso el cero si es una cifra significativa.
En el numero 727.0 el cero no se usa para
localizar el punto decimal es significativo
43. Ejemplos:
0.216 Tres Cifras significativas.
90.7 Tres cifras significativas.
800.0 Cuatro cifras significativas.
0.0670 Tres cifras significativas
44. TERMINOS IMPORTANTES
Precisión.
• El término precisión describe la reproducibilidad de los
resultados y se puede definir como la concordancia que
hay entre los valores numéricos de dos o más
mediciones que se han realizado de idéntica manera.
La precisión sólo depende
de la distribución
de los errores aleatorios
y no se relaciona
con el valor verdadero ni
con el valor especificado.
45. PRECISION
• Para describir la precisión de un conjunto
de datos repetidos se utilizan tres
términos muy conocidos:
• La desviación estándar, la varianza y el
coeficiente de variación.
46. • La desviación estándar (DS/DE) es una
medida de dispersión usada en
estadística que nos dice cuánto tienden a
alejarse los valores puntuales del
promedio en una distribución.
Asi la varianza es la media de los cuadrados de las
diferencias entre cada valor de la variable y la
media aritmética de la distribución. Aunque esta
fórmula es correcta, en la práctica interesa realizar
inferencias poblacionales, por lo que en el
denominador en vez de n, se usa n-1
47. TERMINOS IMPORTANTES
• METODOS ABSOLUTOS PARA EXPRESAR LA PRECISION
• Desviación estándar S= Xi-X
n-1
• Desviación respecto a la media es la diferencia
numérica entre un valor experimental y la media
• Varianza: S2
• Coeficiente de variación. C.V = S/Media
*100
48. TERMINOS IMPORTANTES
• Desviación estándar relativa (DER) : se
calcula al dividir la desviación estándar
entre la media del conjunto de datos.
• DER se expresa en partes por mil o en %.
• DER * 100% = CV.
• Dispersión (W): Es la diferencia entre el
valor mas alto y el valor mas bajo del
conjunto
49. TERMINOS IMPORTANTES
• EXACTITUD : El término denota el grado
de coincidencia del resultado de una
medición con el valor verdadero o
aceptado de la misma y se expresa en
función del error. La exactitud implica una
comparación con el valor verdadero o
aceptado como tal.
• Cuando no se conoce el valor verdadero
se debe usar un valor aceptado.
50. TERMINOS IMPORTANTES
• METODOS PARA MEDIR LA EXACTITUD
• Error absoluto: Es la diferencia entre el valor
experimental y el valor real.
• Error relativo: Es el error absoluto dividido por la
cantidad medida.
• Ejemplo:
• Una muestra tiene 20.34% de Fe y un analista
encuentra que es 20.44%.
• Error Absoluto = 20.44-20.34 = 0.10%
• Error relativo = 0.1/20.34 = 0.0049 = 4.9 partes por
mil
51. TERMINOS IMPORTANTES
• En términos generales la exactitud
supone una comparación con un valor
verdadero o aceptado como tal, la
precisión indica la concordancia entre las
medidas que han sido realizadas de una
misma forma.
52. Esquema gráfico para comprender la
relación entre exactitud y precisión
En C existe buena precisión, pero no buena exactitud;
en A buena exactitud y precisión, y en B mala exactitud
y precisión.
www.galeon.com/scienceducation/error00.htm
54. EVALUACION DE LOS DATOS ANALITICOS
• ESTUDIANTE RESULTADOS COMENTARIO
DE UNA TITULACION
A 10.08 Preciso pero
10.11 inexacto
10.09
10.10
10.12
B 9.88
10.14
10.02 Exacto pero
9.80 impreciso
10.21
10.19
C 9.79 Inexacto e
9.69 impreciso
10.05
9.78
55. EVALUACION DE LOS DATOS ANALITICOS
• ESTUDIANTE RESULTADOS COMENTARIO
DE UNA TITULACION
10.04
9.98
D 10.02 EXACTO Y
9.97 PRECISO
10.04
56. TIPOS DE ERRORES EN DATOS
EXPERIMENTALES
ERRORES
• Bruto Aleatorios Sistemáticos
Ocurre de manera - = indeterminados - = determinados
Ocasional . suele ser -Afectan la presicion - Afectan la exactitud
Grandes. Dan como o la reproducibilidad o sea la proxim al valor
resultado valores verdadero.
atípicos que difieren - Los resultados caen - Todos los
resultados
mucho de los demás. a lado y lado de la X son erróneos en el
mismo sentido.
57. ERRORES DETERMINADOS O SISTEMATICOS
FUENTES DE ERRORES
SISTEMÁTICOS
• Errores instrumentales: Calibraciones
deficientes
• Errores del método: Dificiles de identificar
• Errores personales: Descuido, Falta de atención
58. EFECTO DE LOS ERRORES SISTEMATICOS
EN LOS RESULTADOS ANALITICOS
• Los errores sistemáticos pueden ser constantes o
proporcionales
• En los errores constantes el error absoluto es invariable
con el tamaño de la muestra ,mientras el error relativo
cambia al modificar dicho tamaño.
• Los errores proporcionales aumentan o disminuyen
según el tamaño de la muestra. Con los errores
proporcionales el error absoluto varia con el tamaño de
la muestra, en cambio el error relativo permanece
constante.
59. EFECTO DE LOS ERRORES SISTEMATICOS
EN LOS RESULTADOS ANALITICOS
• Los errores sistemáticos pueden ser constantes
o proporcionales.
• En los errores constantes, el error absoluto es
invariable con el tamaño de la muestra, mientras
en el error relativo cambia al modificar el
tamaño de la muestra.
• Los errores proporcionales aumentan o
disminuyen según el tamaño de la muestra; con
estos errores el error absoluto varia con el
tamaño de la muestra en cambio el error relativo
permanece constante.
60. EVALUACION DE LOS DATOS
ANALITICOS
KAl(SO4)2.12H2O
gtomados
Al2O3
g
tomados
Al2O3
Encontrados
conelNH3
almacenado
Diferencia
eng
Al2O3
Encontrados
conelNH3
Nuevo
Diferencia
eng
1 0.1077 0.1288 0.0211 0.1087 0.001
2 0.2154 0.2384 0.0230 0.2187 0.0024
3 0.3231 0.3489 0.0258 0.3258 0.0027
4 0.4308 0.4588 0.0280 0.4352 0.0044
61. EVALUACION DE LOS DATOS
ANALITICOS
• Los errores ocasionados por el amoniaco
envasado durante mucho tiempo fueron
constantes por que se utilizo el mismo
volumen y el aporte de Si fue el mismo. El
NH3 del envase recién utilizado fueron
muy pequeños y proporcionales al tamaño
de muestra.
62. ERRORES ALEATORIOS
• Son la principal fuente de incertidumbre
en una determinación.
• Muchas variables no controladas y de no
fácil identificación causan errores
aleatorios.
• El efecto acumulativo de las
incertidumbres, aunque estas sean muy
pequeñas, hace que las mediciones por
duplicado de una serie fluctúen al azar.
63. FUENTES DE LOS ERRORES
ALEATORIOS
Los errores aleatorios obedecen una curva
normal de error o curva de gauss.
meted.ucar.edu/nwp/pcu1/ensemble_es/print.htm
65. Distribución normal
• Al iniciar el análisis estadístico de una
serie de datos, y después de la etapa de
detección y corrección de errores, un
primer paso consiste en describir la
distribución de las variables estudiadas y,
en particular, de los datos numéricos.
• Un modo es con la curva de distribución
normal que muestra la frecuencia con que
se repiten los datos.
66. TRATAMIENTO ESTADISTICO DEL ERROR
ALEATORIO
• Los métodos estadísticos permiten categorizar y
caracterizar los datos, y tomar decisiones
objetivas en cuanto a su calidad e
interpretación.
• Hay que diferenciar entre muestra y población o
universo. ( caso del análisis de Ca en agua. La
población seria un numero de medidas muy
grande cercano al infinito).
• Las leyes de la estadística se dedujeron para
usarlas en poblaciones. Para aplicarlas a
muestras se debe hacer ajustes.
67. TRATAMIENTO ESTADISTICO DEL
ERROR ALEATORIO
• Las curvas gaussianas se pueden
representar por medio de una ecuación
que tiene la media de la población µ, y la
desviación estándar de la población σ.
• La media de la población es µ y la media
de la muestra es X.
68.
69.
70. EVALUACION DE METODOS
ANALITICOS
• Ejemplo 2. La N de una solución se calculo con 4
titulaciones por separado y los resultados fueron 0.2041,
0.2049, 0.2039, y 0.2043. Calcular la X, la Mediana, El
rango , La S. la desviación relativa y el C.V.
• X = (0.2041+0.2049+0.2039+0.2043)/4 = 0.2043
• Mediana M= (0.2041+0.2043)/2 = 0.2042
• Rango R = 0.2049-0.2039 = 0.001
• La desviación relativa= Sumatoria de (Xi-X)/4=0.0003
• S= 0.0004
• C.V = (0.0004/0.2043)*100 = 0.2%
71.
72. PRESENTACION DE LOS DATOS CALCULADOS
• Siempre es necesario indicar el nivel de
confianza de los datos.
• Es un rango de valores en los que con
una probabilidad determinada está un
valor verdadero poblacional.
• Generalmente son del 95% o 99%.
• La probabilidad de equivocarnos se llama
nivel de significancia y se simboliza α
73. PRUEBA DE SIGNIFICANCIA
• Se utiliza para comparar el resultado de
un análisis realizado por dos métodos
diferentes. Se trabaja con las X
• Se aplica el T de student. Plantea la
hipótesis de que las dos X son iguales. La
prueba T da una respuesta si o no a la
hipótesis nula con cierta exactitud como
del 95 o 99%
74. Prueba de significancia
• t = X1 – X2 n1n2
S n1+n2
Si t calculado es mayor que t de la tabla
entonces los dos métodos son iguales
Para poder calcular t hay que calcular
primero la s de cada serie de datos
75. • Cuando se escoge el nivel de
significación 0,05 (ó 5%),
tenemos un 95% de confianza de
que hemos adoptado la decisión
correcta y una probabilidad 0,05
de ser falsa.
76. Cómo determina si un valor es realmente un
valor atípico y cómo decide si debe continuar
o no con el análisis de datos?
Uno de los problemas en el análisis de datos es
manejar los valores atípicos dentro de un grupo
de datos.
Un valor atípico es una observación con un valor
que no parece corresponderse con el resto de los
valores en el grupo de datos.
Por lo general surgen dos preguntas:
1)¿Es este valor realmente un valor atípico?
2)¿Puedo eliminar este valor y continuar con el
análisis de datos?
77. DATOS ATIPICOS
Con respecto a la pregunta 2, debe saberse
que las pruebas estadísticas se utilizan
para identificar valores atípicos, no para
retirarlos del grupo de datos.
Técnicamente, una observación no debe
retirarse a menos que una investigación
halle una causa probable para justificar
esta acción
78. DATOS ATIPICOS
Si en la investigación no se encuentra una causa
probable, ¿qué debe hacerse?
Un enfoque sería realizar un análisis de datos con
el valor atípico y sin él. Si las conclusiones son
diferentes, entonces se considera que el valor
atípico tiene influencia y esto debería indicarse
en el informe.
Otra opción es utilizar estimadores rigurosos para
caracterizar los grupos de datos, tal como la
mediana de la muestra en lugar de la media.
79. RECHAZO DE DATOS
• Dos de las pruebas estadísticas utilizadas
con mayor frecuencia en un grupo de
datos son la prueba de Dixon y la prueba
de Grubbs.
• La prueba de Dixon utiliza relaciones de
las diferencias entre datos que parecen
atípicos comparados con los valores del
grupo de datos.
80. RECHAZO DE DATOS
• Estas técnicas están diseñadas para detectar un
único valor atípico en un grupo de datos, y por lo
tanto no son adecuadas para la detección de
múltiples valores atípicos.
• Una técnica rigurosa y amplia para identificar
eficazmente múltiples valores atípicos es el
procedimiento para muchos valores atípicos con
generalización extrema de la desviación de
Student.
81. DIXON
Por ejemplo, tomemos los datos 5.3, 3.1,
4.9, 3.9, 7.8, 4.7 y 4.3
Ordenando los datos:
3.1, 3.9, 4.3, 4.7, 4.9, 5.3, 7.8
El tamaño de la muestra es 7, y la relación utilizada es el espacio
entre el valor atípico (7.8) y su vecino más próximo (5.3) dividido
por el espacio entre los valores más grandes y más pequeños en
el grupo.
Por lo tanto, el índice de Dixon es:
(7.8 – 5.3)/(7.8 – 3.1) = 2.5/4.7 = 0.532
82. RECHAZO DE DATOS
Este valor se compara con un valor crítico de una tabla, y
el valor se declara valor atípico si supera ese valor
crítico.
Si Dcalculado>Dtabulado se rechaza el dato
El valor tabulado depende del tamaño de la muestra, n, y
de un nivel de confianza elegido, que es el riesgo de
rechazar una observación válida. La tabla por lo general
utiliza niveles de baja confianza tal como 1% o 5%.
Para un n = 7 y un riesgo del 5%, el valor en la tabla es
0.507. El índice de Dixon 0.532 excede este valor crítico,
indicando que el valor 7.8 es un valor atípico.
83. DIXON
La prueba de Dixon se usa en un número
pequeño de observaciones (menor a 26) y
detecta elementos que se encuentren
sesgados o que son extremos.
Para aplicar la prueba de Dixon se
requiere de un número de observaciones
igual o mayor a 10. En el caso que las
observaciones sean menores a 10 se
utiliza como valor esperado el valor de
preparación.
84. GRUBBS
La prueba de Grubbs utiliza una estadística
de prueba, T, que es la diferencia absoluta
entre el valor atípico, XO, y el promedio de
la muestra (X) dividida por la desviación
estándar de la muestra, s.
Para el ejemplo anterior, el promedio de la
muestra es = 4.86 y la desviación estándar
de la muestra es = 1.48. La estadística
calculada de la prueba es:
85. GRUBBS
Para un n = 7 y un riesgo del 5%, el valor
tabulado es 1.938 y el TCalculado = 1.99 excede
este valor crítico, indicando que el valor
7.8 es un valor atípico.
86. TEST DE GRUBB PARA DATOS
SOSPECHOSOS
Recomendado por las normas ISO
G= Valor Sospechoso – X
S
(Con el valor sospechoso incluido)
Si Gcalculada > Gtabulada el valor sospechoso se rechaza
87. TEST Q DE DATOS SOSPECHOSOS
Aceptar o rechazar un resultado anómaloAceptar o rechazar un resultado anómalo (outlier)
Normalmente se producen al cometer errores o fallos
en la metodología aplicada.
Se ordenan los datos en forma creciente y se calcula Q
Q = desvío = Diferencia entre el dato sospechosos y su vecino más cercano
recorrido Diferencia numérica entre el dato de mayor valor y el de menor valor
Si Qcalculada > Qtabulada el dato se rechaza
88. Ejemplo:
Al efectuar una serie de réplicas para determinar la
concentración del ión sulfato en una muestra de agua
para riego se obtuvieron los siguientes resultados.
Determinar si la medida 6.0 es un valor rechazable.
Medida Valor
1 5.0
2 5.2
3 5.5
4 5.6
5 6.0
1. Se ordenan los datos en orden de valor
decreciente
6.0, 5.6, 5.5, 5.2, 5.0
2. Se calcula Q
Q= (6.0-5.6)/ (6.0-5.0) =0.40
3. Se compara Q calculado con Q tabulado
para 5 medidas y un nivel de confianza del
90. Qtab=0.64
0.40<0.64, luego el valor 6.0 no es
rechazable
89. DESCARTE DE DATOS
1. Definir que tan grande es la Diferencia entre el valor
sospechoso y los otros datos.
2. Aplicar Prueba Q.
a) Ordenar los datos
b) Calcular el rango
c) Encontrar la diferencia entre el resultado sospechosos
y su vecino mas cercano
3. Dividir la diferencia obtenida en el paso 2 entre el
Rango. Así se obtiene el coeficiente de descartacion
Q.
4. Consultar la tabla de valores Q. Si el valor calculado es
mayor que el de latabla el resultado se puede
descartar con un 90% de confianza de que si se podia.
90.
91. DESCARTE DE DATOS
• EJEMPLO
• 4 Resultados de N de una solución fueron
0.1014, 0.1012, 0.1019, 0.1016. Se podrá
descartar 0.1019?
• X sin el 0.1019 = 0.1014
0.1019-0.01014 =0.0005
• Q = 0.1019 - 0.1016 =0.43
0.1019 – 0.1012
• 0.43 es menor que 0.76. NO SE DESCARTA
92.
93. PRESENTACION DE LOS DATOS
CALCULADOS
• Un indicador de la calidad de los datos es
la utilización de las cifras significativas.
• Cifras significativas: Son todos los dígitos
que se conocen con certeza y el primer
digito incierto. Por ejemplo 30.24 tiene 4
cifras significativas (4, el ultimo digito, es
incierto)
94. PRESENTACION DE LOS DATOS
CALCULADOS
• El cero puede ser significativo o no según
su ubicación en el numero. Un cero
rodeado por otros dígitos siempre es
significativo.
• Los ceros al final pueden o no ser
significativos. 2.0 tiene dos cifras
significativas. 2000 tiene una cifra
significativa. 2x103
tiene una.
95. PRESENTACION DE LOS DATOS
CALCULADOS
• Para las sumas y las restas el resultado debe
tener el mismo numero de decimales que el
numero que tiene menos decimales.
• Cuando se suman o restan números con
notación científica se debe expresar el
resultado en la misma potencia de 10.
• En la multiplicación y la división se debe
expresar el resultado con las cifras
significativas del numero que tenga menor
cifras significativas.
96. PRESENTACION DE LOS DATOS
CALCULADOS
• Redondeo de datos:
• Se debe aproximar al numero mayor si el ultimo
es mayor de 5 y al menor si el ultimo es menor
de 5.
• 61.555 se aproxima al numero par mas
cercano . Queda 61.56
• De todas maneras el resultado debe expresarse
con la desviación estándar calculada.
97. OBJETIVOS DEL MUESTREO
• Estadísticamente los objetivos del
proceso de muestreo son:
• 1. Obtener el valor medio
• 2. Obtener una varianza que sea una
estimación de la varianza poblacional con
limites de confianza validos para la media.
98. VALIDACION DE METODOS ANALITICOS
Calidad de resultados
• Selectividad Analito en medio de interferencias
• Limite de detección Promedio de bcos +3(desviación)
• Limite de cuantificación 5 ò 10 L.D.
• Intervalo de trabajo Rango en que el método es exacto y preciso.
• Rango lineal
• Exactitud. Valor de referencia
• Precisión Desviación y CV
• Sensibilidad Pendiente
• % Recuperación. Adición de cantidades conocidas
• GRÁFICOS DE CONTROL.
99. VALIDACION DE METODOS ANALITICOS
• Curvas de calibración
• Linealidad
• Pendiente
• Sensibilidad
• Residuales
• Coeficiente de correlación
100. VALIDACION DE METODOS
ANALITICOS
• Curvas de calibración: Mínimos
Cuadrados
• Modelo de regresión: Y=mx+b
• Cuanto mas cercanos están los datos a la
línea que se obtiene del análisis por
mínimos cuadrados, menores son los
residuales
En el caso de la distribución normal, coinciden la media, la mediana y la moda. Una forma empírica de juzgar si una distribución es simétrica consiste en comparar la mediana y la media.