2. Introducción
Cualquier característica que pueda medirse o
clasificarse Variable!
Si toma valores tales que cualquier resultado sea al
azar: aleatoria
Variable aleatoria:
Posee una distribución de probabilidad
correspondiente para describir su
comportamiento.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
3. Discretas:
Especifica todos los valores posibles de la variable
junto con la probabilidad de que cada uno ocurra.
Continuas:
Nos permite determinar las posibilidades asociadas
con intervalos de valores específicos.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
4. Definición
Distribución normal
La más importante de todas las distribuciones de
probabilidad.
Una de sus características más importantes es que
casi cualquier distribución de probabilidad, tanto
discreta como continua, se puede aproximar por
una normal bajo ciertas condiciones.
Gauss descubrió distribución de los errores de
observaciones astronómicas.
Campana de Gauss al representar su función de
probabilidad, ésta tiene forma de campana.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
5.
6. Características
La curva normal tiene forma de campana y un solo pico en
el centro de la distribución.
La media, la mediana y la moda de la distribución son
iguales y se localizan en el pico.
La mitad del área bajo la curva se encuentra a la derecha
de este punto central y la otra mitad está a la izquierda.
La distribución de probabilidad normal es simétrica
alrededor de su media.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
7. • La curva normal desciende suavemente en ambas
direcciones a partir del valor central.
Es asintótica, lo que quiere decir que la curva se acerca
cada vez más al eje X pero jamás llega a tocarlo.
Las “colas” de la curva se extienden de manera
indefinida en ambas direcciones.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
8. Para indicar que una variable aleatoria (v.a.) sigue una distribución normal
de media μ y desviación estándar σ usaremos la expresión: X ∼ N(μ,σ).
9. La probabilidad de que una variable aleatoria (v.a.) X
tome un valor determinado entre dos números reales a
y b coincide con el área encerrada por la función:
Que es (función de densidad de probabilidad) entre
los puntos a y b, es decir
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
10. Gráficos de normalidad
Es una técnica gráfica, utilizada para contrastar la
normalidad de un conjunto de datos.
La idea básica consiste en representar, en un mismo
gráfico, los datos empíricos observados, frente a los
datos que se obtendrían en una distribución normal
teórica.
11. Gráfico Q-Q
Se realizara a través de los
cuantiles de la normal estándar, de
forma que aceptaremos la hipótesis
de normalidad de los datos,
siempre que los puntos en el gràfico
tengan un comportamiento
“suficientemente rectilíneo”.
En el caso de que se den
desviaciones sustanciales de la
linealialidad, los estadísticos
rechazan la hipótesis nula de
similitud.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
12. Box plot
Apropiada para representar variables que
presenten una gran desviación de la
distribución normal
Resultan de gran ayuda cuando se dispone de
datos en distintos grupos de sujetos.
Presenta una caja donde con tres lineas
características de los datos:
La línea del centro representa la mediana.
Las lineas superior e inferior representa el tercer
cuartil y el primer cuartil.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
13. Histograma
Un histograma es una representación
gráfica de una distribución de
frecuencia. La información está
dividida en intervalos de clase y
representada por rectángulos. Estos
están hechos en el eje X. En el eje Y, el
analista traza las frecuencias de la
información. Cada rectángulo
representa el número de frecuencias
que se encuentran dentro de ese
intervalo particular de clase.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
14. Hojas y tallos
Tambien denominado Stem-and-Leaf
Dado un conjunto de datos formado por observaciones, las
cuales pueden ser representadas mediante y donde cada
tiene por lo menos dos dígitos. Una forma rápida de
obtener una representación visual del conjunto de datos es
construir un diagrama de tallos y hojas.
Nos dan una idea de la localización de los datos y de la
forma de la distribución Esta técnica funciona bien para
los conjuntos de datos que no tienen una dispersión muy
grande.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
15.
16. ¿Qué es un sesgo?
También denominado SIMETRÍA
Hace referencia al grado en que valores de la variable
equidistantes a un valor que se considere centro de la
distribución, poseen frecuencias similares.
Será simétrica si la mitad izquierda de la distribución es
la imagen de la mitad derecha.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
17. Media y mediana coinciden en las distribuciones
simétricas. Si sólo hay una moda (distribución
unimodal), el valor de ésta también será igual a las dos
anteriores.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
18. Distribuciones unimodales:
El nivel de simetría se suele describir de acuerdo a
tres grandes categorías:
Distribuciones simétricas
Distribuciones asimétricas positivas (o asimetría a la
derecha)
Distribuciones asimétricas negativas (o asimetría a
la izquierda).
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
19. Es decir…
Según la moda, estas categorías de asimetría vienen
definidas por el diferente grado de dispersión de los
datos a ambos lados (colas):
La cola más dispersa en el lado de los valores altos de la
variable caracteriza a la asimetría positiva.
Si en el lado de los más bajos, a la asimetría negativa.
Si la dispersión es igual o muy similar a ambos lados, a
una distribución de frecuencias simétrica.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
20. En caso de asimetría, los valores de la media, de la
mediana y de la moda difieren.
Si la asimetría es positiva: X > Mdn ≥ Mo.
Si es negativa: X< Mdn ≤ Mo.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
21. El coeficiente de curtosis mide cuan “puntiaguda” es
una distribución respecto de un estándar.
Este estándar es una forma acampanada denominada
“normal”, y corresponde a una curva de gran
importancia en estadística.
El coeficiente de curtosis está definido por:
¿qué es curtosis?
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
22. De acuerdo a su valor, la “puntudez” de los datos
puede clasificarse en tres grupos:
Leptocúrticos, con valores grandes para el
coeficiente.
Mesocúrticos, con valores medianos para el
coeficiente.
Platicúrticos, con valores pequeños para el
coeficiente.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.
23. Una curva Mesocúrtica tiene un Coeficiente de
Curtosis cercano a cero.
Una Leptocúrtica, un valor notoriamente mayor que
cero.
Una Platicúrtica valores menores que cero.
Pagano, Gauvreau. Fundamentos de Bioestadística. Ed Math Learning. 2ª. Edición. México: 2010.