2. Introducción
• La distribución normal o distribución de Gauss, representa
la forma en que se distribuyen en la naturaleza los diversos
valores numéricos de las variables continuas.
Johann Carl Friedrich Gauss
1777-1855.
3. • La curva normal es un polígono de frecuencias en forma de campana para el que están
calculadas sus áreas en función de los diversos valores del eje horizontal o abscisa.
• En la abscisa se encuentran valores de tipo cuantitativo continuo, denominados
genéricamente como valores de Z, cuyas magnitudes en teoría pueden ir de izquierda a
derecha desde -∞ hasta +∞.
• El promedio de todos los valores Z de la abscisa equivale a 0, pues la mitad son
negativos y la mitad son positivos.
Propiedades de la curva normal
4. • En el sitio de la abscisa que corresponde al 0 (promedio), se encuentra
la parte más alta de la curva.
• En este sitio también se encuentra la mediana de todos los valores Z de
la abscisa, pues 50% de ellos está antes del 0 y el 50% restante se
encuentra después.
5. • La curva es simétrica alrededor del promedio.
• En la abscisa existen segmentos unitarios de igual
longitud y tamaño .
• Los segmentos a la izquierda del promedio tienen
signo negativo y los segmentos a la derecha del
promedio tienen signo positivo.
• Se les denomina desviaciones estándar, pueden
dividirse en fracciones infinitamente pequeñas y
continuas.
6. • La curva es asintótica (sus extremos nunca tocan la abscisa).
• Se acostumbra graficar tres segmentos a la izquierda y tres
segmentos a la derecha del promedio.
• Toda el área bajo la curva vale 1. Por lo tanto el área a la
izquierda del promedio vale 0.5, y el área de la derecha
también 0.5
7. • El área que se encuentra sobre el segmento de la abscisa
que va desde el promedio hasta el valor de Z de +1, vale
0.3413; por simetría el valor de Z -1 también vale 0.3413.
• Por lo tanto, el área de -1 a +1, vale 0.6826.
• El área que se encuentra sobre el segmento de la abscisa
que va mas allá del valor de Z, vale 0.1587.
8. 1. Tener forma de campana.
2. Ser simétrica (asimetría = 0).
3. No ser excesivamente plana ni excesivamente picuda
(mesocúrtica).
4. La curva tiene dos puntos de inflexión situados a una
desviación típica de la media. Es convexa entre ambos
puntos de inflexión y cóncava en ambas colas.
Características de la distribución normal
9. 5. Coincidir en ella la media, la mediana y la moda.
6. Tener aproximadamente el 95% de sus valores dentro del intervalo μ ±
2 σ (media ± 2 desviaciones estándar). Exactamente, el 95% de los
individuos se encuentra dentro del intervalo comprendido por μ ± 1,96 σ.
Además, casi el 100% de los valores está dentro del intervalo μ ± 3 σ.
7. Ser la distribución muestral que siguen los índices o estimadores
estadísticos calculados en una muestra.
10. • El modelo normal constituye la distribución de probabilidad
para variables aleatorias continuas más importante de toda la
estadística.
• La función de densidad de probabilidad que describe el
modelo normal es:
• Donde :
Media = μ
Varianza = σ2
Modelo normal
11.
12. Dada la imposibilidad de contar con una tabla para cada una de las
distribuciones normales con cualquier media y cualquier desviación
típica, el cálculo de probabilidades sobre este tipo de distribuciones
se realiza a partir de una única tabla correspondiente a la
distribución normal con media 0 y desviación típica 1 que recibe el
nombre de normal estándar.
Para ello será necesario transformar la variable objeto de estudio en
una variable con media 0 y desviación típica 1, proceso que recibe
el nombre de tipificación, y que se consigue restando la media y
dividiendo por la desviación típica.
13. O bien de acuerdo a Villa Romero y Altamirano, la
transformación de valores X a valores Z; uso de la tabla de
áreas bajo la curva
14. Curtosis
• Se refiere a la medida de la forma de una distribución en comparación con la
distribución normal, también conocida como campana de Gauss.
• A través de esta medida, podemos descubrir si una distribución tiene colas
pesadas o ligeras, así como si su pico es más pronunciado o suave.
15. Tipos de Curtosis
• Leptocúrtica: Una distribución leptocúrtica
tiene una curtosis positiva. Esto significa que
tiene colas más pesadas y un pico más
pronunciado.
• Mesocúrtica: Es una curtosis cercana a
cero. Similar a la de una distribución
normal.
• Platicúrtica: Tiene una curtosis negativa.
Tiene colas más ligeras y un pico más suave
en comparación con la distribución normal.
16. Estas pruebas permiten determinar si la población de la cual se obtuvo
la muestra sigue la distribución normal, identificación que resulta
clave para la aplicación del procedimiento estadístico adecuado para
el análisis de los datos en un determinado estudio y para la
correspondiente contrastación de hipótesis cuando se requiere que,
previamente se haya comprobado el supuesto de normalidad de los
datos.
Pruebas de Normalidad
17. Pruebas de Normalidad :
1)Anderson-Darling (AD): es una medida de qué tan bien se ajustan
sus datos a una distribución específica. Se usa comúnmente como
una prueba de normalidad.
• El estadístico esta dado por:
Ecuación 1
N: número de casos
S: desviación estándar
18. 2) Ryan-Joiner (RJ): Mide qué tan bien se ajustan los datos a una
distribución normal, calculando la correlación entre los datos y las
puntuaciones normales de los datos. Es una prueba no paramétrica.
Resulta mucho más adecuada, para muestras superiores a 30
observaciones.
Donde Yi= Observaciones ordenadas bi= puntuaciones
normales de las observaciones ordenadas S 2= Varianza
19. 3. Prueba de Shapiro-Wilk: Este test se emplea para contrastar normalidad
cuando el tamaño de la muestra es menor a 50 observaciones.
Consiste en comenzar ordenando la muestra de menor a mayor valor,
obteniendo el nuevo vector muestral.
Su lógica se basa en las desviaciones que presentan las estadísticas de
orden de la muestra, respecto a los valores esperados de los estadísticos de
orden de la normal estándar
Donde Yi son los datos de la
muestra, ordenados por tamaño .
20. 4. Prueba de Kolmogórov-Smirnov: es una prueba de bondad de ajuste
utilizada para probar la normalidad de los datos muestrales, siendo útil en
procesos físicos no lineales e interactivos, por cuanto éstos conducen,
generalmente, a distribuciones no gaussianas.
Ventajas
• No requiere agrupación de los datos.
• El estadístico de la distribución de
frecuencias esperada, solo depende del
tamaño de la muestra.
Desventajas
• Solo se aplica al análisis de
variables continuas como peso,
calificaciones, hora, dinero.
21. ¿para que se usa?
• Para comparar una muestra con una distribución de probabilidad de
referencia (de una sola muestra de prueba K-S), o para comparar dos
muestras (dos muestras de prueba K-S).