Se presenta una forma de evaluar la normalidad. En base del libro Fundamentos de estadisticas para las ciencias de la vida. Se utiliza el programa R para general algunas graficas.
1. Distribuciones continuas
MSc Edgar Madrid Cuello
Departamento de Matemática, UNISUCRE
Estadística I
2016
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 1 / 16
2. Distribución normal
Denición (Grácas de probabilidad normal)
Una gráca de probabilidad normal es una gráca estadística especial que
se utiliza para evaluar la normalidad. algunos autores la presentan para
evaluar la no normalidad
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 2 / 16
3. Distribución normal
Denición (Grácas de probabilidad normal)
Una gráca de probabilidad normal es una gráca estadística especial que
se utiliza para evaluar la normalidad. algunos autores la presentan para
evaluar la no normalidad
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 2 / 16
4. Ejemplo
Las alturas (en pulgadas) de una muestra de , 11 mujeres, es:
61 62.5 63 64 64.5 65 66.5 67 68 68.5 70.5
hist(alturas, freq=F, xlab=Altura,right = F,
col=terrain.colors(6, alpha = 1), main= )
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 3 / 16
5. Ejemplo
Las alturas (en pulgadas) de una muestra de , 11 mujeres, es:
61 62.5 63 64 64.5 65 66.5 67 68 68.5 70.5
hist(alturas, freq=F, xlab=Altura,right = F,
col=terrain.colors(6, alpha = 1), main= )
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 3 / 16
6. Altura
Density
60 62 64 66 68 70 72
0.000.020.040.060.080.100.120.14
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 4 / 16
8. curve(dnorm(x,65.5,2.9), add=T, lwd=2)
Es difícil examinar, a simple vista un histograma y decidir si tiene forma
acampanada o no, para esto se ha desarrollado una gráca visualmente mas
simple, la gráca de la probabilidad normal. Una gráca de probabilidad
normal es un diagrama de dispersión, de datos esperados1 vs datos
observados, si los datos provienen de una distribución, no muy alejada de la
normal, los puntos de esta gráca deberían ajustarse a un segmento de la
línea recta f(x) = x, que es mucho más fácil de reconocer que la forma de
campana del histograma.
1
los valores que habría que esperar si la población fuera normal
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 6 / 16
9. curve(dnorm(x,65.5,2.9), add=T, lwd=2)
Es difícil examinar, a simple vista un histograma y decidir si tiene forma
acampanada o no, para esto se ha desarrollado una gráca visualmente mas
simple, la gráca de la probabilidad normal. Una gráca de probabilidad
normal es un diagrama de dispersión, de datos esperados1 vs datos
observados, si los datos provienen de una distribución, no muy alejada de la
normal, los puntos de esta gráca deberían ajustarse a un segmento de la
línea recta f(x) = x, que es mucho más fácil de reconocer que la forma de
campana del histograma.
1
los valores que habría que esperar si la población fuera normal
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 6 / 16
10. curve(dnorm(x,65.5,2.9), add=T, lwd=2)
Es difícil examinar, a simple vista un histograma y decidir si tiene forma
acampanada o no, para esto se ha desarrollado una gráca visualmente mas
simple, la gráca de la probabilidad normal. Una gráca de probabilidad
normal es un diagrama de dispersión, de datos esperados1 vs datos
observados, si los datos provienen de una distribución, no muy alejada de la
normal, los puntos de esta gráca deberían ajustarse a un segmento de la
línea recta f(x) = x, que es mucho más fácil de reconocer que la forma de
campana del histograma.
1
los valores que habría que esperar si la población fuera normal
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 6 / 16
11. curve(dnorm(x,65.5,2.9), add=T, lwd=2)
Es difícil examinar, a simple vista un histograma y decidir si tiene forma
acampanada o no, para esto se ha desarrollado una gráca visualmente mas
simple, la gráca de la probabilidad normal. Una gráca de probabilidad
normal es un diagrama de dispersión, de datos esperados1 vs datos
observados, si los datos provienen de una distribución, no muy alejada de la
normal, los puntos de esta gráca deberían ajustarse a un segmento de la
línea recta f(x) = x, que es mucho más fácil de reconocer que la forma de
campana del histograma.
1
los valores que habría que esperar si la población fuera normal
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 6 / 16
12. Se comparan los valores reales observados de las alturas de mujeres que
esperaríamos ver si los datos provinieran de una población normal.Por
ejemplo, la mujer más baja de nuestra muestra tiene una altura de 61
pulgadas. Es decir. 1/11 (o 0.0909) de la muestra tiene valores de 61
pulgadas o menos. Si las alturas de las mujeres siguieran realmente una
distribución normal, de media 65,5 y la desviación típica 2,9. entonces se
puede esperar que el percentil 9,09 sea
µ + Z1−0.09091σ = 65, 5 − 1, 34 × 2, 9, o 61.6 pulgadas.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 7 / 16
13. Se comparan los valores reales observados de las alturas de mujeres que
esperaríamos ver si los datos provinieran de una población normal.Por
ejemplo, la mujer más baja de nuestra muestra tiene una altura de 61
pulgadas. Es decir. 1/11 (o 0.0909) de la muestra tiene valores de 61
pulgadas o menos. Si las alturas de las mujeres siguieran realmente una
distribución normal, de media 65,5 y la desviación típica 2,9. entonces se
puede esperar que el percentil 9,09 sea
µ + Z1−0.09091σ = 65, 5 − 1, 34 × 2, 9, o 61.6 pulgadas.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 7 / 16
14. Se comparan los valores reales observados de las alturas de mujeres que
esperaríamos ver si los datos provinieran de una población normal.Por
ejemplo, la mujer más baja de nuestra muestra tiene una altura de 61
pulgadas. Es decir. 1/11 (o 0.0909) de la muestra tiene valores de 61
pulgadas o menos. Si las alturas de las mujeres siguieran realmente una
distribución normal, de media 65,5 y la desviación típica 2,9. entonces se
puede esperar que el percentil 9,09 sea
µ + Z1−0.09091σ = 65, 5 − 1, 34 × 2, 9, o 61.6 pulgadas.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 7 / 16
15. Este valor es cercano al valor observado de 61 pulgadas. Podríamos repetir
este tipo de cálculo para cada uno de los 11 valores de los datos
observados. Una gráca de probabilidad normal proporciona una
comparación visual de estos valores.
El primer paso para crear una gráca de probabilidad normal, por tanto, es
calcular los percentiles muéstrales. El siguiente ejemplo presenta la forma
de realizar este cálculo, que en general es realizado por los paquetes de
software estadístico.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 8 / 16
16. Este valor es cercano al valor observado de 61 pulgadas. Podríamos repetir
este tipo de cálculo para cada uno de los 11 valores de los datos
observados. Una gráca de probabilidad normal proporciona una
comparación visual de estos valores.
El primer paso para crear una gráca de probabilidad normal, por tanto, es
calcular los percentiles muéstrales. El siguiente ejemplo presenta la forma
de realizar este cálculo, que en general es realizado por los paquetes de
software estadístico.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 8 / 16
17. Ejemplo (Altura de 11 mujeres)
Cálculo de índices y percentiles de las alturas de 11 muje
i 1 2 3 4 5 6 7
Altura Observada 61 62.5 63 64 64.5 65 66.5
Percentil ajustado 100(i − 0.5)/11
z
Altura teórica
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 9 / 16
18. Toma de decisiones sobre normalidad.
Si los puntos de una gráca de probabilidad normal no están más o menos
a lo largo de una línea recta, esto es una indicación de que los datos no
provienen de una población normal. Por ejemplo, si la parte alta de la
gráca se curva, esto signica que los valores de x en el extremo superior
de la distribución son demasiado grandes para que la distribución tenga
forma de campana. Es decir, la distribución está sesgada hacia la derecha o
tiene outliers grandes, como se muestra en la Figura
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 10 / 16
19. Toma de decisiones sobre normalidad.
Si los puntos de una gráca de probabilidad normal no están más o menos
a lo largo de una línea recta, esto es una indicación de que los datos no
provienen de una población normal. Por ejemplo, si la parte alta de la
gráca se curva, esto signica que los valores de x en el extremo superior
de la distribución son demasiado grandes para que la distribución tenga
forma de campana. Es decir, la distribución está sesgada hacia la derecha o
tiene outliers grandes, como se muestra en la Figura
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 10 / 16
20. Figure: gura 3
1.png
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 11 / 16
21. Si la parte baja de la gráca se curva hacia abajo, esto signica que los
valores de x en el extremo inferior de la distribución son demasiado
pequeños para que la distribución tenga forma de campana. Es decir, la
distribución esta sesgada hacia la izquierda o tiene outliers pequeños. La
Figura 4 presenta la distribución del contenido de humedad en la fruta agua
dulce del Ejemplo 4.4.2. que está fuertemente sesgada hacia la izquierda.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 12 / 16
22. Si la parte baja de la gráca se curva hacia abajo, esto signica que los
valores de x en el extremo inferior de la distribución son demasiado
pequeños para que la distribución tenga forma de campana. Es decir, la
distribución esta sesgada hacia la izquierda o tiene outliers pequeños. La
Figura 4 presenta la distribución del contenido de humedad en la fruta agua
dulce del Ejemplo 4.4.2. que está fuertemente sesgada hacia la izquierda.
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 12 / 16
23. 2.png
Figure: gura 4
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 13 / 16
24. Si la distribución tiene una cola muy larga hacia la izquierda y una cola
larga hacia la derecha, al compararla con la curva normal la gráca de
probabilidad normal tendrá una forma parecida a una S. La Figura 5
muestra una distribución de ese tipo.
5.png
Figure: 5. Histograma y gráca de probabilidad normal de una distribución que
tiene colas largas
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 14 / 16
25. Algunas veces un mismo valor aparece repetidamente en una muestra,
debido al redondeo del proceso de medida. Esto produce una granularidad
en la gráca de probabilidad normal, como la Figura 6, pero esto no evita
que sigamos deduciendo que la distribución subyacente es normal.
6.png
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 15 / 16
26. @BookFEC1,author = Myra L. Samuels, Jerey A. Witmer, Andew A.
Schaner, editor = PEARSON EDUCACION, S.A., title = Fundamentos
de Estadistica para las Ciencias de la Vida, publisher = 4a edicion, year =
2012, volume = 1, OPTaddress = Madrid, pages134-145
MSc Edgar Madrid Cuello Departamento de Matemática, UNISUCRE Estadística IDistribuciones continuas 2016 16 / 16